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(57) Abstract 

The invention concerns in particular the human flavin-containing monooxygenase 2 (hFM02), and another human enzyme of the 
FMO, hFMOx family, their nucleotide and polypeptide sequences. The invention also concerns vectors for cloning and/or expression 
containing said nucleotide sequences and cells transformed by these vectors and method for preparing said polypeptides. The invention 
further concerns methods for selecting compounds and of diagnosing predisposition to pathologies and/or deficiencies related to FMO*s and 
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La pr6sente invention conceme notamment la fiavine mono-oxygdnase 2 humaine (hFM02), ainsi qu*une autre enzyme humaine 
de la famille FMO, hFMOx, leurs sequences nucWotiques et polypeptidiques. La pr6sente invention conceme figalement des vecteurs de 
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de preparation desdits polypeptides. L* invention comprend aussi des m6thodes de selection de compos6s et de diagnostic de predisposition 
21 des pathologies et/ou des d6ficiences li6es aux FMOs ainsi que des compositions pharmaceutiques comportant lesdits composes destines 
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Sequence, nucleotidiaue codant pour une flavine mono- 
oxygenase, proteine correspondante et leurs applications 
dans les domaines du diagnostic et de la therapie 

La presente invention concerne notamtnent la 

5 flavine mono- oxygenase 2 humaine (hFM02) , ainsi qu'une 
autre enzyme humaine de la famille FMO, hFMOx, leurs 
sequences nucleotidiques et polypeptidiques , La presente 
invention concerne egalement, des vecteurs de clonage et/ou 
d' expression contenant lesdites sequences nucleotidiques et 

10 des cellules transformees par ces vecteurs ainsi que des 
methodes de preparation desdits polypeptides. L* invention 
comprend aussi des mSthodes de selection de composes et de 
diagnostic de predisposition S des pathologies et/ou des 
deficiences liees aux FMOs ainsi que des compositions 

15 pharmaceutiques comportant lesdits composes destines au 
traitement et/ou a la prevention de ces pathologies. 

Les flavines mono -oxygenases (FMOs) (Lawton et 
al , , 1994) forment une famille d'enzymes microsomales 
catalysant I'oxydation NADPH- dependant e de nombreux 

20 composes organiques exogenes (xenobiotiques) possedant un 
heteroatome nucleophile comme en particulier 1 ' atome 
d' azote, de soufre, de phospore ou de selenium (Ziegler, 
D.M., 1988 ; Ziegler, D.M., 1993), qu'il s'agisse de 
medicaments, de pesticides ou autres substances 

25 potentiellement toxiques. La cystSamine est le seul 
substrat endogene actuellement connu des FMOs. 

Les FMOs E^epresentent une famille multigenique . 
L' expression de formes differentes de FMOs est dependante a 
la fois du tissu et de 1 ' espece consideres. 

30 Les FMOs ont ete localisees dans differents 

types de tissus, en particulier le foie, les poumons et les 
reins. 

A ce jour, cinq isoformes des FMOs ont ete 
caracterisees dans 1' espece de reference, le lapin. Leur 
35 homologie est de 50-60 %. Quatre de ces isoformes, FMOl, 
FMOS, FM04 et FMC5 ont et^ identifiees chez I'homme 
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(sequences GeneBank M64082, M83772, Z11737 et L37080 
respectivement) . Parmi les especes mammiferes, I'homologie 
entre FMO orthologues est superieure a 80 %. L' existence 
d'une FM02, voire d'autres isoformes, chez I'homme, peut 

5 etre raisonnablement postulee. 

Les FMOs sont associees au reticulum 
endoplasmique et sont impliquees dans la detoxification de 
composes xenobiotiques, la mono -oxygenation permettant de 
transformer le xenobiotique en substance plus polaire, 

10 Stape preliminaire avant son excretion. Elles peuvent 
egalement etre impliquees dans 1' activation metabolique de 
differents composes toxiques et/ou carcinogenes presents 
dans 1 * environnement . 

Le mecanisme de la reaction FMO a ete decrit de 

15 maniere detaillee (Poulsen, L,L. et al . , 1995). Par 
opposition a toutes les autres oxydases ou mono- oxygenases 
connues, les FMOs ont la propriete unique de former une 
enzyme intermediaire stable 4a-hydropSroxy flavine, 
NADP(H)- et oxygene- dependant e, en 1 'absence de substrat 

20 oxydable. Parce que 1 * energie de catalyse est deja presente 
dans 1' enzyme FMO avant le contact avec son substrat 
potentiel, 1' adequation du substrat n'a pas besoin d'etre 
aussi precise que pour d' autres types d' enzymes, Cette 
caracteristique specifique de la FMO est responsable de la 

25 grande variete de substrats acceptes par les FMOs (incluant 
par exemple les alkyl- et aryl-amines tertiaires et 
secondaires, de nombreuses hydrazines, thiocarbamides, 
thioamides, sulfides, disulfides, thiols) . 

De nombreuses molecules, composes actifs de 

30 medicaments, sont reconnues comme substrats des FMOs, soit 
pour une N-oxydation, soit pour une S-oxydation (Gasser, 
1996) , parmi lesquels on trouve notamment des anti- 
depresseurs, des antipsychotiques, des anti-ulcereux, des 
vasodilatateurs et des anti-hypertenseurs . 

35 Bien que certains substrats de FMO soient oxyd^s 

en derives moins actifs, de nombreux composes nucleophiles 
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peuvent etre metabolises en intermediaires pouvant etre 
plus reactifs et/ou potentiellement toxiques ; plutot que 
d'§tre excretes, de tels produits peuvent induire des 
reponses toxiques par fixation covalente a des 

5 macromolecules cellulaires, ou par d'autres mecanismes. Par 
exemple, les mercaptopyrimidines et les thiocarbamides 
peuvent etre actives de maniere predominante par une 
activite FMO (Hines et al . , 1994), De maniere plus precise, 
il a ete montre que la nephrotoxicite associee au conjugue 

10 glutathion de I'acroleine est liee a son metabolisme medie 
par la FMO renale ; la FMO forme un S-oxyde qui est ensuite 
libere, par reaction d' elimination catalys^e en milieu 
basique, sous forme d'acroleine cytotoxique {Park, S.B. et 
al . , 1992). Ainsi, les FMOs peuvent jouer un role important 

15 aussi bien dans les premieres etapes de toxicite chimique 
que dans la detoxification de composes xenobiotiques . 

Comme decrit ci-dessus, un grand nombre de 
medicaments aujourd^hui en phase d'essais cliniqiies, ou 
largement prescrits, contiennent des fonctions a caractere 

20 nucleophile de type azote, soufre, phosphore ou autres. Le 
role de la FMO dans le metabolisme oxydatif des medicaments 
et des composes chimiques endogenes chez l*homme est 
cependant mal connu . 

Cashman et al. (1996) ont recemment etudie les 

25 contributions des enzymes FMOs dans le metabolisme 
physiologique de la cimetidine et de la S-nicotine in vivo. 
La plus grande partie de leurs resultats confirme le fait 
que 1' activite FM03 du foie d'adulte est responsable de 
1 * oxygenation de la cimetidine et de la S-nicotine, cette 

30 oxygenation etant stereospecif ique . Les auteurs montrent en 
outre que la stereochimie des metabolites principaux de la 
cimetidine et de la S-nicotine chez des petits animaux 
d' experimentation est distincte de celle observee chez 
I'homme, et suggerent que differentes isoformes de FMOs 

35 pouvant etre predominant es selon les especes, ceci peut 
avoir des consequences importantes quant au choix des 
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animaux d ' experimentation pour les programmes d' elaboration 
et de developpement de medicaments chez I'homme. 

La FMOl est connue pour etre exprim§e chez 
I'homme dans les reins, mais pas dans le foie. La FM02 est 
5 exprimee majoritairement dans les poumons chez toutes les 
especes de mammiferes testees. La FM03 a ete isolee chez 
I'homme dans le foie ou elle est predominante chez 
I'adulte. La FM03 est I'isoforme majeure impliquee dans la 
sulf oxydation de la methionine et dans 1 * oxygenation 

10 stereospecif ique de la cimetidine et de la S-nicotine. La 
FM03 presente une specif icite pour son substrat plus grande 
que celle des FMOl trouvees dans le foie de la plupart des 
especes animales etudiees. La FM04 est une isoforme mineure 
dont la fonction et la specificite de substrat sont peu 

15 connues. Elle est presente dans le foie humain et est aussi 
exprimee dans le cerveau ou elle pourrait etre impliquee 
dans 1' oxydation de medicaments antidepresseurs comme 
1 » imipramine . La FM05 est exprimee dans le foie de I'homme 
de maniere moins importante que la FM03 . Son apparent 

20 manque d'efficacite en tant qu' enzyme impliquee dans le 
metabolisme de medicaments, suggere qu*elle pourrait etre 
impliquee dans une fonction physiologique , 

Les differents profils d' expression des 
isoformes de FMO selon les tissus et/ou especes constituent 

25 done probablement un facteur significatif contribuant aux 
differences d'activites FMO observees entre les tissus 
et/ou entre especes . -Ainsi, la variete des formes de FMOs 
pourrait avoir un impact significatif sur la difference des 
reponses de tissus et/ou especes a 1' exposition a un 

30 compose xenobiotique . En effet, les differences observees 
entre les tissus et/ou especes dans la reponse aux composes 
xenobiotiques et dans leur toxicite sont liees pour une 
part importante aux variations d'activite et de specificite 
impliquees dans le metabolisme de ces substrats par les 

35 FMOs. Facteurs genetiques et specificite tissulaire dans 
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1' expression des FMOs sont des facteurs importants de ces 
variations . 

Concernant les facteurs genetiques, il a ete 
decrit par exemple que la trimethylaminurie, pathologie 
5 presente chez 1 % de sujets blancs britanniques et qui se 
manifeste par une forte odeur de poisson avarie dans l*air 
expire, la sueur ou 1' urine, est liee a une deficience 
d'origine genet ique du f onctionnement d'une FMO hepatique. 

Pour les raisons evoquees precedemment , il 

10 existe done aujourd'hui un besoin important d* identifier de 
nouvelles isoformes de FMO ainsi que les polymorphismes 
genetiques eventuellement associes, presentant des 
specificites quant a leurs substrats et/ou leur profil 
d' expression tissulaire, qui pourraient etre impliquees 

15 dans le metabolisme de xenobiotiques , tel que le 
metabolisme de medicaments ou de substances exogenes 
presentes dans 1 *environnement comme par exemple les 
pesticides, ou encore qui pourraient etre impliquees dans 
une fonction physiologique . Ceci est precisement I'objet de 

20 la presente invention. 

Plusieurs genes de la famille des FMOs humaines 
ont ete localises sur la region lq23-25 du chromosome 1 par 
hybridation in situ du chromosome en metaphase. 

Des lors qu'une telle region candidate a ete 

25 definie, il est necessaire d* avoir acces au fragment du 
genome couvrant l*intervalle ou se situe(nt) le{s) gene(s) 
recherche (s) . Cette etape passe par 1 * etablissement d'une 
carte physique, a savoir le recouvrement de la region par 
un ensemble de fragments clones et ordonnes. Aujourd'hui, 

30 grSce aux donnees de la carte integree CEPH/Genethon du 
genome humain, environ 80 % du genome est recouvert par des 
clones de YACs, sous clones en BACs dont la localisation 
sur les chromosomes se fait par 1 ' intermediaire de 
marqueurs polymorphes et genetiquement ordonnes (Chumakov 

35 et al., 1995). Cette carte physico-genetique permet de 
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gagner un temps considerable, notamment par 1 ' utilisation 
du sequengage exhaustif des regions d'interet. 

Ainsi selon la presente invention, il a ete 
Stabli, apres localisation du BAG 123H04M sur le locus 
5 gen§tique lq24-25 pr§cedemment cite, que 1 * insertion qu'il 
porte contient les parties 3' de hFMOB, 5' de hFMOl, ainsi 
que la sequence complete de hFM02, et celle d'un autre 
nouveau gene membre de la famille FMO, le hFMOx. 

En outre, grace a 1 'utilisation de banques 

10 d' etiquettes 5', on peut verifier 1* expression des genes 
candidats identifies comme precedemment : 1 ' identification 
d*une etiquette hybridant a I'une des sequences candidates 
indique, puisque celle-ci est issue d'une banque d'ADNc, la 
presence d*ARNm et done d'une expression des sequences en 

15 question dans les tissus consideres. 

C'est pourquoi la presente invention concerne 
notamment un polynucleotide isole, dont la sequence SEQ ID 
N** 1 est partiellement representee sur la Figure 2, et qui 
20 code pour un polypeptide de sequence SEQ ID N** 3 
representee sur la Figure 1. 

La presente invention concerne egalement un 
polynucleotide isole, dont la sequence SEQ ID N** 4 est 
partiellement representee sur la Figure 10, et qui code 
25 pour un polypeptide de sequence SEQ ID 6. 

Ces deux sequences nucleotidiques sont celles de 
deux genes codant pour de nouvelles enzymes de la famille 
des mono-oxygenases a flavine (FMO) humaines, 

30 respect ivement hFM02 et hFMOx. Ceci a ete etabli par 
comparaison des sequences identifiees aux sequences deja 
connues de FMO : des homologies structurales tres fortes 
entre les deux sequences etudiees et celles des FMO, des 
homologies tres fortes entre la premiere sequence et les 

35 FM02 connues, notamment celle de macaque (FM02 de macaque : 
sequence GeneBank U59453) , ainsi qu'une homologie non 
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suffisante .de la seconde sequence avec aucune des FMO deja 
repertoriees chez I'homme ont permis de conclure. 

La structure exonique des genes de la famille 
FMO deja connus est entierement conservee dans la sequence 
5 nucleotidique hFM02 selon 1* invention. Les sequences de 
chacun des 9 exons du polynucleotide selon 1 ' invention 
(Figure 3) presentent des degres d'homologie variant de 
95 % a 98 % en ADN avec la sequence correspondante de I'ARN 
messager de la FM02 de macaque (Figure 4) . Les divergences 

10 entre les deux sequences nucleotidiques , ainsi que leur 
signification envers la sequence peptidique, sont 
presentees sur la Figure 5. La sequence polynucleotidique 
SEQ ID N** 1 selon 1* invention code pour un polypeptide de 
sequence SEQ ID N° 3 de 535 acides amines (Figure 1) ; la 

15 sequence SEQ ID N° 2 de I'ARN messager predite, ainsi que 
la sequence polypeptidique de la proteine humaine sont 
homologues a 97 % avec celles de la FM02 de macaque 
(Figures 6 et 7), ce qui a permis 1 ' identification du 
polypeptide selon 1* invention comme etant la FM02 humaine. 

20 Le polypeptide de sequence SEQ ID N*' 3, represente S la 
Figure 1, presente egalement un haut degre d'homologie avec 
d'autres f lavines-mono-oxygenases 2 de mammiferes ; ses 
degres d'homologie avec d'autres proteines de la famille 
des f lavines-mono-oxygenases sont moins forts. 

25 Comme mentionne precedemment , 1 ' absence d'homologie 

suffisante entre les sequences correspondant a hFMOx - 
sequences g^nomique fSEQ ID N° 4) , d'ARN messager (SEQ ID 
N*> 5) , et peptidique (SEQ ID N° 6) - et les sequences des 
FMOs connues, a permis de conclure qu'il s'agit d'une 

30 nouvelle isoforme de FMO. 

La presente invention concerne done les 
sequences d'ADN ou d'ARN, I'ADN pouvant etre genomique, ADN 
complementaire ou synthetique, des FMOs, notamment de hFM02 
et hFMOx, ainsi que les proteines correspondantes . 

35 La presente invention concerne en outre des 

vecteurs de cloaage et/ou d' expression contenant lesdites 



wo 98/24914 



8 



PCT/FIW/02226 



sequences nucleotidiques , des cellules transf ormees par ces 
vecteurs ou des animaux contenant lesdites cellules, ainsi 
que des methodes de preparation desdits polypeptides sous 
la forme de polypeptides recombinants. 
5 L* invention comprend aussi des methodes de 

selection de compose capable de moduler l*activite FMO. 

L' invention concerne egalement des methodes de 
diagnostic de predisposition a des troubles lies a FMO 
ainsi que des compositions pharmaceutiques destinees au 

10 traitement et/ou S la prevention de ces troubles, 

Un premier exemple de tels troubles pourrait 
etre le glaucome primaire a angle ouvert (GPAO) . En effet, 
d'une part Sunden et al . (1996), ainsi que les inventeurs 
(Belmouden et al . , 1996), ont identifie la region 

15 chromosomique GLCIA, qui porte entre autres sequences de 
genes celles connues de la famille des FMOs, en lq23-25, 
comme li€e a la survenue du GPAO juvenile (GPAO- J) . D* autre 
part, un role possible des mono -oxygenases dans l*etiologie 
du glaucome a precedemment ete suggere (Schwartzman et al., 

20 1987). En effet, des metabolites de reactions d'oxydation, 
en inhibant I'activite Na+, K+ ATPase dans la cornee, 
contribueraient a la regulation de la transparence de la 
cornee et de la secretion humorale oculaire ; or, une 
opacite de la cornee et une hypertension oculaire sont les 

25 deux criteres majeurs de diagnostic de glaucome, 

Ainsi, un site d* heterozygotie, presentant une 
segregation d*ordre -genotypique dans une famille etudiee 
pour la presence en son sein de nombreux membres atteints 
de GPAO-J, a ete identifie par les inventeurs dans 1 ' exon 8 

30 du polypeptide hFM02 selon 1' invention. 

En poursuivant la recherche des polymorph! smes 
presents dans des populations choisies de fagon adequate, 
et situes dans des sequences correspondant a celles portees 
par 1' insertion du BAG 123H04M, ou plus generalement par 

35 les sequences FMOs, on pourra identifier notamment les 
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mutations associees aux pathologies ou troubles lies a une 
alteration de FMO. 

Les dif ferentes isoformes des FMOs * semblent 
moins se distinguer par la specificite tissulaire de leur 
5 expression, que par les substrats dont elles catalysent la 
transformation. Comme indique precedemment , 1* expression 
des FMOs a ete mise en evidence dans le foie, les poumons, 
les reins ou le cerveau. 

L'effet pathogene d'un deficit fonctionnel d'une 
10 FMO pourrait resulter d'une capacity diminuee des tissus oil 
elle s'exprime a resister au stress oxydatif. 

Plus genSralement , par leur role dans le 
metabolisme oxydatif et leur fonction de detoxification, 
les FMOs pourraient etre impliquees dans toute pathologie 
15 degenerative ou toxique, demontree ou a prouver, notamment 
celles ou une mort cellulaire programmee peut etre mise en 
evidence, et les maladies degeneratives du systeme nerveux 
central . 

De facpon generale, les pathologies liees au 
20 f onctionnement des FMOs, sont rassemblees sous le nom de 
« troubles lies a FMO ». 

Parmi les troubles lies a FMO, on peut citer par 
exemple, mais sans s'y limiter : 

- oxydation de medicaments, substrats de FMO, en derives 
25 moins actifs, impliquant une perte d'efficacite dudit 

medicament ; 

- non metabolisation- de medicaments actifs sous forme de 
metabolites, perte d'efficacite dudit medicament ; 

- non metabolisation de xenobiotiques toxiques et/ou 
30 carcinogenes, dont des substances exogenes presentes 

naturellement dans 1 ' alimentation, telles que des 
alcaloides vegetaux, ou des substances toxiques 
presentes dans 1 ' environnement , telles que les 
pesticides ou les herbicides / 
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- metabolisation de medicaments en intermediaires pouvant 
etre plus reactifs, impliquant un surdosage avec 
possibilite d*effet secondaire ; 

- metabolisation de xenobiotiques, dont les medicaments ou 
5 autres substances exogenes, en intermediaires pouvant 

etre potentiellement toxiques ; et/ou 

- alteration de la fonction physiologique dans laquelle 
est impliquee la FMO ; en particulier, 1' alteration du 
fonctionnement de FMO, pourrait etre impliquee dans la 

10 symptomatologie du glaucome. 

Par « FMO on entendra designer I'une 

quelconque des FMOs humaines connues, FMOl, FM03 , FM04 et 

FM05, ou nouvellement decrites dans la presente demande de 

brevet, a savoir FM02 ou FMOx. 
15 Certains de ces troubles pourront avoir une 

origine multigenique mais pour tous, les modifications 

d'une ou plusieurs FMOs contribuent a la survenue du 

trouble ou k son aggravation. 

Les sequences nucleotidiques 
20 La presente invention concerne, tout d'abord, 

une sequence nucleotidique isolee, caracterisee en ce 

qu'elle est choisie parmi : 

a) les sequences codant pour les proteines FM02 ou FMOx 
humaines et leurs variants proteiques, 
25 b) les sequences codant pour un fragment de ces proteines 
et ayant au moins 10 bases, 

c) les sequences genomiques FM02 ou FMOx humaines et leurs 
alleles, 

d) les sequences presentant au moins 80 %, et de preference 
30 au moins 90 %, d'homologie avec les sequences (a) et (c) , 

e) les fragments des sequences (c) ou (d) ayant au moins 10 
bases, 

f) les sequences qui s*hybrident avec une sequence de (a) a 
(e) . 

35 . II doit etre compris que la presente invention 

ne concerne pas les sequences nucleotidiques genomiques 
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dans leur environnement chromosomique natural, c*est-a-dire 
a I'etat naturel, il s'agit de sequences qui ont ete 
isolees, c ' est-a-dire qu'elles ont ete prelevees 
directement ou indirectement , par exemple par copie (ADNc) , 
5 leur environnement ayant ete au moins partiellement 
inodif i^. 

Ainsi, il peut s'agir aussi bien d'ADNc que 
d'ADN genomique partiellement modifi§ ou porte par des 
sequences au moins partiellement differentes des sequences 
10 les portant naturellement . 

Ces sequences pourront egalement etre qualifiees 
de « non naturelles x> . 

Par <K sequence nucleique on entend un 

fragment d'ADN et/ou d'ARN naturel isole, ou de synthese, 
15 designant un enchainement precis de nucleotides, modifies 
ou non, permettant de definir un fragment, un segment ou 
une region d*un acide nucleique . 

Par <c alleles y>, on entend designer les 
sequences mutees naturelles correspondant a des 
20 polymorphismes pouvant exister chez I'etre humain et, 
notamment, ceux qui peuvent conduire au developpement de 
troubles lies a FMO. 

Par « variant prot6ique », on entend designer 
1' ensemble des proteines mutees pouvant exister chez I'etre 
25 humain, qui correspondent notamment a des troncatures, 
substitutions, deletions et/ou additions de residus 
d* amino-acides, ainsi que les variants artificiels qui 
seront neanmoins egalement appeles « variants proteiques », 
Dans le cas present, les variants sont lies en partie a la 
30 survenue de troubles lies a FMO. 

Selon 1* invention, les fragments de sequences 
nucleiques peuvent notamment coder pour des domaines de la 
proteine ou bien etre utilises comme sonde ou comme amorce 
dans des precedes de detection ou d' identification ou 
35 d' amplification. Ces fragments presentent une taille 
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minimale .de 10 bases et on preferera des fragments de 20 
bases, et de preference 30 bases. 

Selon 1' invention, I'homologie est uniquement de 
type statistique, elle signifie que les sequences 

5 presentent au minimum 80 %, et pref 6rentiellement 90 %, de 
nucleotides en commun. 

Pour ce qui concerne les sequences (f ) , les 
conditions d' hybridation doivent permettre, selon 
1* invention, d* assurer au moins 95 % d^homologie. 

10 Plus particulierement , la presente invention 

concerne une sequence nucleotidique choisie parmi : 
a) les sequences codant pour un polypeptide comprenant les 
amino-acides selon la sequence SEQ ID N** 3, ou selon la 
sequence SEQ ID N*=» 6, 

15 b) les sequences nucleiques de SEQ ID N** 1 ou N° 2, ou les 
sequences nucleiques representees Figures 2 et 1, ou les 
sequences nucleiques de SEQ ID N° 4 ou N° 5, ou les 
sequences nucleiques representees Figure 10, ou les 
sequences nucleiques codant pour les polypeptides 

20 correspondant s , 

c) un fragment d'une sequence selon (a) ou (b) comportant 
au moins 10 bases, et 

d) une sequence qui comporte par rapport aux sequences (a) , 
(b) ou (c) au moins une mutation ponctuelle, 

25 e) une sequence complementaire des sequences (a) , (b) , (c) 
ou (d) . 

La Figure -1 represente la sequence SEQ ID N° 3, 
la Figure 2 represente partiellement la sequence SEQ ID 
N° 1 de FM02, la Figure 10 represente partiellement la 

30 sequence SEQ ID N° 4 de FMOx, telles qu'elles ont ete 
sequencees sur un genome d'un individu ne presentant pas de 
troubles FMO visibles. 

La structure du gene de hFM02 est identifiee 
dans la Figure 3 . 

35 La sequence SEQ ID N° 4 de FMOx est 

partiellement representee sur la Figure 10. 
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Pour ce qui concerne les remarques particuli^res 
sur (a) , (b) , (c) , (d) et (e) , les remarques precedentes 
s * appliquent . 

L' invention concerne egalement des fragments de 
5 ces sequences, en particulier des sequences codant pour des 
polypeptides ayant garde tout ou partie de l*activite de la 
proteine FMO. 

Certaines de ces sequences peuvent etre 
identifiees en se reportant notamment a la Figure 3 qui 

10 schematise 1 * organisation de hFM02 . 

Ces sequences partielles peuvent etre utilisees 
pour de nombreuses applications, comme cela sera decrit ci- 
apres, notamment pour effectuer des constructions 
proteiques de type FMO ou de types diffSrents, mais 

15 egalement pour realiser par exemple des proteines FMO- like. 

Si les sequences decrites sont, en general, les 
sequences normales, 1 * invention concerne egalement les 
sequences mutees dans la mesure ou elles comportent au 
moins une mutation ponctuelle et de preference au plus 10 % 

20 de mutation. 

De preference, la presents invention concerne 
des sequences nucleotidiques mutees dans lesquelles les 
mutations ponctuelles sont non muettes, c'est-a-dire 
qu' elles conduisent a une modification de 1 ' amino-acide 

25 code par rapport a la sequence normale . De f agon encore 
preferee, ces mutations portent sur des amino-acides qui 
structurent les proteines FMO ou les fragments 
correspondants de celles-ci, notamment dans les regions 
correspondant aux sites catalytiques , aux sites regulateurs 

30 ou aux sites de fixation des cofacteurs ; les mutations 
peuvent egalement porter sur les sequences impliquees dans 
le transport et I'adressage ; elles peuvent aussi en 
particulier supprimer les cysteines ou, au contraire, en 
faire apparaitre, mais egalement changer le caractere de la 

35 proteine, soit sur le plan de la charge, soit sur le plan 
de 1 * hydrophobicite . 
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La presente invention concerne egalement les 
mutations pouvant intervenir dans les sequences promotrices 
et/ou regulatrices des genes FMO humains, lesquelles 
peuvent avoir des effets sur 1 'expression de la proteine, 

5 notamment sur son taux d' expression, 

De facpon generale, la presente invention 
s'interesse aussi bien aux proteines FMO normales qu'aux 
proteines FMO mutees, ainsi qu'a leurs fragments et aux 
sequences d'ADN et d*ARN correspondantes . 

10 Parmi les fragments nucleotidiques pouvant etre 

interessants, notamment pour le diagnostic, il faut citer 
egalement les sequences genomiques introniques du gene FMO, 
par exemple les sequences jonctions entre les introns et 
les exons . 

15 L' invention comprend les sequences nucleo- 

tidiques selon 1' invention, caracterisees en ce qu'elles 
comprennent au moins la mutation G.1263mac.A, telle qu'elle 
sera definie ci-apres dans les exemples. 

L* invention comprend egalement les sequences 

20 nucleotidiques selon 1' invention, caracterisees en ce 
qu'elles comportent au moins 10 bases ainsi que lesdites 
sequences nucleotidiques, utilisables notamment comme 
amorce specif ique d'un allele. 

L' invention comprend egalement les sec[uences 

25 nucleotidiques selon 1* invention, utilisables notamment 
comme amorce nucleique, de preference caracterisees en ce 
que lesdites sequences sont choisies parmi les sequences 
SEQ ID N<> 7, SEQ ID 8, SEQ ID N° 9 et SEQ ID N<> 10. 

L* invention concerne en outre les sequences 

30 nucleotidiques selon 1' invention, utilisables notamment 
comme sonde specif ique d'un allele, de preference 
caracterisees en ce que lesdites sequences sont choisies 
parmi les sequences SEQ ID N° 11, SEQ ID 12, SEQ ID N*> 
13 et SEQ ID N° 14. 
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L' invention a egalement pour objet les sequences 
nucleotidiques selon 1* invention, caracterisees en ce que 
lesdites sequences codent pour I'un des domaines de FMO. 

Les polypeptides codes par les sequences 
5 nucleotidiques selon 1' invention, notamment les 
polypeptides de sequence SEQ ID N** 3 ou SEQ ID N° 6, font 
bien entendu partie de 1' invention. 

Dans la presente description, les termes de 
proteine, polypeptide ou peptide sont interchangeables . 

10 La presente invention concerne 1' ensemble des 

amorces qui peuvent etre deduites des sequences 
nucleotidiques precedentes et qui peuvent permettre de les 
mettre en evidence en utilisant une methode d* amplification 
telle que la methode PGR. 

15 La presente invention concerne egalement les 

sequences nucleotidiques qui peuvent comport er des 
nucleotides non naturels, notamment des nucleotides soufres 
ou de structure a ou p. 

Enfin, la presente invention concerne, bien 

20 entendu, aussi bien les sequences ADN qu'ARN, ainsi que les 
sequences qui s'hybrident avec el les, de meme que les ADN 
double brin correspondants . 

Parmi les fragments d'acides nucleiques 
interessants, il faut citer en particulier les oligo- 

25 nucleotides anti-sens, c'est-a-dire dont la structure 
assure, par hybridation avec la sequence cible, une 
inhibition de 1' expression du produit correspondant . II 
faut egalement citer les oligonucleotides sens qui, par 
interaction avec des proteines impliquees dans la 

30 regulation de 1' expression du produit correspondant, 
induiront soit une inhibition, soit une activation de cette 
expression. 

Comme cela sera decrit ci-apres, pour certaines 
applications, il peut etre necessaire de prevoir des 
35 constructions mixtes, proteine/ADN/compose chimique, 
notamment 1 ' utilisation d* agents intercalants par exemple ; 
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il doit §tre compris que de tels composes sont converts par 
le brevet comme comportant une s§quence selon 1' invention. 
Les proteines et polypeptides 

La presente invention concerne egalement les 

5 proteines, polypeptides ou peptides correspondant aux 
sequences mentionnees precedemment , sous forme non 
naturelle, c*est-a-dire qu'elles ne sont pas prises dans 
leur environnement naturel mais qu'elles ont pu etre 
obtenues par purification ^ partir de sources naturelles ou 

10 bien obtenues par recombinaison genetique, comme cela sera 
decrit ci-apres. 

L' invention concerne egalement les memes 
polypeptides ou proteines obtenus par synthese chimique et 
pouvant comporter des amino-acides hon-naturels . 

15 La presente invention concerne les proteines 

recombinantes ainsi obtenues aussi bien sous forme 
glycosylee que non glycosylee et pouvant presenter ou non 
la structure tertiaire naturelle. 
Les vecteurs et les cellules 

20 La presente invention concerne egalement des 

vecteurs de clonage et/ou d' expression comportant une 
sequence nucleotidique telle que decrite precedemment . 

Ces vecteurs de clonage et d' expression pourront 
comporter des elements assurant 1' expression de la sequence 

25 dans une cellule bote, notamment des sequences promotrices 
et des secjuences de regulation efficaces dans ladite 
cellule. 

Le vecteur en cause pourra etre a replication 
autonome ou bien destine a assurer 1 * integration de la 
30 sequence au sein des chromosomes de la cellule hote. 

Dans le cas de systemes a replication autonome, 
en fonction de la cellule bote, procaryote ou eucaryote, on 
utilisera de preference des systemes de type plasmidique ou 
des systemes viraux, les virus vecteurs pouvant etre 
35 notamment des adenovirus (Perricaudet et al . , 1992), des 
retrovirus, des poxvirus ou des virus herpetiques (Epstein 
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et al . , 1992). L*homme de metier connait les technologies 
utilisables pour chacun de ces virus. 

Ainsi, il est connu d'utiliser comme vecteur 
viral des virus defectifs dont la culture est effectuee 
5 dans des cellules de complementation, ceci evitant les 
risques eventuels de proliferation d'un vecteur viral 
inf ectieux. 

Lorsque 1 * on souhaitera 1 ' integration de la 
sequence dans les chromosomes de la cellule bote, il sera 

10 necessaire de prevoir de part et d' autre de la sequence 
nucleotidique ^ integrer une ou plusieurs sequences 
provenant de la cellule hote afin d' assurer la 
recombinaison. Il s'agit la egalement de precedes qui sont 
largement decrits dans la technique anterieure. On pourra, 

15 par exemple, utiliser des systemes de type plasmidique ou 
viral ; de tels virus seront, par exemple, les retrovirus 
(Temin 1986) ou les AAV, Adenovirus Associated Virus 
(Carter 1993) . 

L* invention concerne egalement les cellules 

20 procaryotes ou eucaryotes transformees par un vecteur tel 
que decrit precedemment et ceci afin d' assurer 1' expression 
d'une proteine FMO naturelle ou variante ou bien, par 
exemple, d'un de ses domaines. 

Les animaux, caracterises en ce qu'ils 

25 contiennent une cellule transformee selon 1' invention, font 
egalement partie de 1* invention. 

L' invent ioQ. comprend en outre un precede de 
production d*un polypeptide selon 1' invention, caracterise 
en ce qu'on cultive une cellule selon 1 ' invention et en ce 

30 que l*on recupere la proteine produite. 

Comme cela a ete indique precedemment, la 
presente invention concerne egalement les polypeptides, 
obtenus par culture des cellules ainsi transformees et 
recuperation du polypeptide exprime, ladite recuperation 

35 pouvant etre effectuee de fagon intracellulaire ou bien de 
facpon extracellulaire dans le milieu de culture lorsque le 
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vecteur a ete congu pour assurer la secretion du 
polypeptide par le biais, par exemple, d*une sequence 
« leader », la proteine etant exprimee sous forme d'une 
pre-proteine ou pre-pro-proteine . Les constructions 

5 permettant la secretion des polypeptides sont connues, 
aussi bien pour des systemes procaryotes que pour des 
systemes eucaryotes. Dans le cadre de la presente 
invention, certains des polypeptides FMO pourront comporter 
leur propre systeme de secretion ou d' insertion 

10 membranaire . 

De preference, 1* invention concerne les 
polypeptides specifiques de formes mutees des proteines 
selon 1* invention, caracterises en ce que leur sequence est 
choisie parmi les sequences polypeptidiques comprenant au 

15 moins une mutation. 

Parmi les cellules utilisables pour la 
production de ces polypeptides, il faut citer bien entendu 
les cellules bacteriennes (Olins et Lee, 1993) , mais 
egalement les cellules de levure (Buckholz, 1993) , de meme 

20 que les cellules animales, en particulier les cultures de 
cellules de mammifere (Edwards et Aruffo, 1993) mais 
egalement les cellules d'insectes dans lesquelles on peut 
utiliser des precedes mettant en oeuvre des baculovirus par 
exemple (Luckow, 1993) . 

25 Les cellules ainsi obtenues peuvent permettre de 

preparer des polypeptides naturels ou variants FMO, mais 
egalement des fragments de ces polypeptides, notamment des 
polypeptides pouvant correspondre aux differents domaines 
en cause, 

30 L» invention comprend egalement les anticorps 

mono- ou polyclonaux diriges centre les polypeptdides selon 
1* invention, de preference, caracterises en ce qu*ils sont 
obtenus par reaction immunologique d'un organisme humain ou 
animal avec un agent immunogene constitue par un 

35 polypeptide selon 1' invention, notamment un polypeptide 
recombinant ou synthetique selon 1 ' invention ; de- 



wo 98/24914 



19 



PCT/FR97/02226 



preference 1* agent immunogene sera constitue par un 
polypeptide specifique de la forme mutee de la proteine 
obtenue selon le precede precedemment decrit, la sequence 
dudit polypeptide etant choisie parmi les sequences 
5 polypeptidiques comprenant au moins une mutation. 

L' invention concerne egalement les anticorps 
selon 1» invention, caracterises en ce qu'il s*agit 
d' anticorps marques, notamment pour I'imagerie. 

Ces anticorps monoclonaux ou polyclonaux marques 

10 et correspondant notamment a tout ou partie des proteines 
mutees pourront etre utilises par exemple comme agent 
d'imagerie, in vivo ou ex vivo sur des prelevements 
biologiques (imagerie a I'aide d' anticorps couples a une 
molecule detectable en imagerie de type PET- scan, par 

15 exemple) , 

Les modeles cellulaires 

Les cellules transformees telles que decrites 
precedemment pourront egalement etre utilisees a titre de 
modele afin d*etudier les interactions entre les FMOs et 

20 les partenaires, composes chimiques et proteiques, 
impliques directement ou indirectement dans l^activite FMO, 
et afin d'etudier les differentes interactions mises en 
cause selon qu'il s'agit d'une FMO normale ou d'un variant. 
Mais surtout ils pourront etre utilises pour la selection 

25 de produits interagissant avec les FMOs, normales ou 
variantes, a titre d'agoniste, notamment d'activateur 
enzymatique, ou d'^ntagoniste, notamment d'inhibiteur 
enzymatique. 

Une autre application potentielle de la 
30 caracterisation de ces genes est done la possibilite 
d' identifier des composes, notamment proteiques, 
interagissant avec ces FMOs. II peut s'agir aussi bien 
d' inhibiteurs que d» activateurs, de substrats ou de 
cofacteurs, par exemple. Leur identification permettra de 
35 les utiliser en fonction de leurs interactions avec la 
proteine normale ou la proteine variante. En particulier, 
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on pourra chercher a isoler des agents ayant des effets 
differents sur les FMOs normales et variantes, 

On pourra aussi utiliser ces modules cellulaires 
pour etudier le metabolisme de xenobiotiques, medicaments 

5 ou autres, par une FMO, normale ou variante. Ceci pourra 
etre mis en oeuvre dans 1 ' identification du pouvoir toxique 
de certains composes, dans la selection et le developpement 
de composes a toxicite reduite, ou a activite accrue, ou 
dans celui de FMOs modifiees, ayant un meilleur pouvoir de 

10 metaboliser les composes d*int€ret. 

Ce type de moddle cellulaire peut §tre realise 
en mettant en oeuvre des techniques de genie genetique, II 
s'agit, suivant le type de cellules que l»on desire 
utiliser, de doner le gene en question sous sa forme 

15 normale ou sous sa forme mutee dans un vecteur 
d' expression, qu*il s*agisse d'un vecteur a replication 
autonome ou d'un vecteur d' integration, ledit vecteur 
comportant 1' ensemble des elements permettant 1' expression 
du gene dans la cellule en cause, ou celle-ci ayant 

20 1' ensemble des elements permettant 1* expression de la 
sequence en cause. 

On obtient ainsi des cellules eucaryotes ou 
procaryotes exprimant la ou les proteines FMO, normales ou 
variantes, qui pourront alors const ituer des modeles 

25 permettant de tester tout a la fois les interactions de 
differents produits avec les proteines FMO ou leurs 
variants, ou de tester des composes, notamment des produits 
chimiques de synthese, pouvant interagir avec le produit du 
gene FMO, normal ou mute, et ce en les ajoutant dans le 

30 milieu de culture desdites cellules. 

II faut, en particulier, remarquer que les 
produits en question pourront aussi bien etre des agents a 
activite antagoniste qu'agoniste. 

L' utilisation de modeles cellulaires en vue de 

35 tester des composes pharmaceutiques est bien connue, la 
encore il n'y a pas lieu de detailler ce type de module. On 
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peut cependant citer, parmi les techniques utilisees, le 
« Phage Display » (Allen et al., 1995), et les methodes de 
double -hybride (Luban et Goff., 1995). 

Ces modules peuvent etre de type in vitro, par 

5 exemple des cultures de cellules humaines, soit en culture 
normale, soit ^ventuellement sous forme d'organe isole. 

La presente invention concerne egalement des 
organismes tels que les animaux, en particulier des souris, 
exprimant le phenotype correspondant a la FMO normale ou 

10 variante d'origine humaine. La encore, ces animaux pourront 
etre utilises comme animaux modeles pour tester 
I'efficacite de certains produits pharmaceutiques . 

La presente invention concerne egalement les 
produits obtenus par la mise en oeuvre des modeles 

15 cellulaires precedents. 
Methode de diagnostic 

La presente invention concerne, comme cela a ete 
dit precedemment , plus particulierement des methodes de 
diagnostic de predisposition a des troubles lies H FMO chez 

20 un patient, caracterisees en ce qu'on determine a partir 
d*un prelevement biologique dudit patient la presence d'une 
mutation dans au moins une sequence codant pour une FMO par 
1' analyse de tout ou partie d'une sequence nucleique 
correspondant audit gene, la presence d*au moins une telle 

25 mutation etant indicative d'une predisposition dudit 
patient a des troubles lies a FMO. 

II est in^ortant de preciser que la presente 
invention ne decrit en detail que hFM02 et hFMOx, mais les 
methodes de diagnostic et les compositions a visees 

30 therapeutiques concernent aussi bien les FMOs precedentes 
que FMOl, FM03 , FM04 et FMOS. En effet, les FMOs en general 
interviennent dans le metabolisme des xenobiotiques et les 
troubles qui y sont associes, tels que, par exemple, les 
xenobiotiques et les troubles lies a FMO cites 

35 precedemment . 
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Parmi les mutations qui sont recherchees, il 
faut citer plus particulierement la mutation G. 1263mac . A. 
(localisee sur la Figure G) . 

Les sequences d'acides nucleiques analysees 
5 pourront etre aussi bien de I'ADN genomique, un ADNc ou un 
ARNm. 

Comme cela a ete dit precedemment, parmi les 
troubles lies a FMO qui peuvent etre mis en evidence, on 
entend plus particulierement les pathologies associ6es au 

10 mStabolisme de xenobiotique telles que citees precedemment , 
ou associees a la fonction biologique de FMO, mais il peut 
exister d'autres troubles qui pourraient etre lies ^ une 
anomalie des FMOs. 

Les outils de diagnostic bases sur la presente 

15 invention, bien qu'ils puissent permettre un diagnostic 
positif et differentiel chez un patient pris isolement, 
seront de preference interessants pour un diagnostic 
presymptomatique chez un sujet a risque, notamment avec 
antecedent familial, et il est possible egalement de 

20 prevoir un diagnostic ante-natal. 

En outre, la mise en evidence d'une mutation 
specif ique peut permettre un diagnostic evolutif, notamment 
quant a I'intensite du trouble ou ^ l*epoque probable de 
son apparition. 

25 Les methodes permettant de mettre en evidence la 

mutation dans un gene par rapport au gene naturel sont, 
bien entendu, tres nombreuses. On peut essentiellement les 
diviser en deux grandes categories, le premier type de 
methode est celui dans lequel la presence d*une mutation 

30 est d^tect^e par comparaison de la sequence mutee avec la 
sequence correspondante naturelle non mutee, et le second 
type dans lequel la presence de la mutation est detectee de 
fa<;:on indirecte, par exemple par la mise en evidence de 
misappariements dus k la presence de la mutation, 

35 Dans les deux cas, on pr^ferera en general les 

methodes dans lesquelles tout ou partie de la sequence 
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correspondant a FMO est amplifiee prealablement a la mise 
en evidence de la mutation, ces methodes d' amplification 
pouvant etre realisees par des methodes dites PGR ou PCR- 
like. Par PCR-like on entendra designer toutes les methodes 

5 mettant en oeuvre des reproductions directes ou indirectes 
des sequences d'acides nucleiques, ou bien dans lesquelles 
les systemes de marquage ont ete amplifies, ces techniques 
sont bien entendu connues, en general il s'agit de 
1 • amplification de I'ADN par une polymerase ; lorsque 

10 1 ' echantillon d*origine est un ARN il convient 
prealablement d'effectuer une transcription reverse. II 
existe actuellement de tres nombreux precedes permettant 
cette amplification, par exemple les methodes dites NASBA 
« Nucleic Acid Sequence Based Amplification » (Compton 

15 1991) , TAS « Transcription based Amplification System » 
(Guatelli et al., 1990), LCR « Ligase Chain Reaction » 
(Landegren et al., 1988), <c Endo Run Amplification » (ERA), 
« Cycling Probe Reaction » (CPR) , et SDA « Strand 
Displacement Amplification » (Walker et al., 1992), bien 

20 connues de 1 ' homme du metier. 

Le Tableau 1 presente des sequences d' amorces 
utilisables pour amplifier les sequences interessant la 
mutation G,1263mac.A. 

Le reactif utilise pour detecter et/ou 

25 identifier une mutation du gene FMO dans un echantillon 
biologique comprend une sonde dite de capture et/ou une 
sonde dite de detection, I'une au moins de ces sondes 
comportant une sequence selon la presente invention decrite 
precedemment . 

30 Recherche de mutations ponctuelles 

De faqron generale, plusieurs methodes de 
detection peuvent etre appliqu§es ou adaptees si 
necessaire, apres amplification des sequences d'interet par 
PGR. A titre d'exemples, on peut citer : 
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1) Sequen<?age : comparaison des sequences de plusieurs 
individus et/ou reperage d'un site d' heterozygotie chez 
un seul individu . 

2) <c Single nucleotide primer extension x> (Syvanen et al., 
5 1990). Des exemples d'amorces utilisables pour detecter 

la mutation G.1263mac.A par cette methode figurent dans 
le Tableau 2 . 

3) RFLP « Restriction Fragment Length Polymorphism ». Un 
exemple d' enzyme de restriction utilisable pour detecter 

10 la mutation G.1263mac.A. par RFLP est presente sur le 

Tableau 3 . 

4) Recherche de <k Single Strand Conformation 
Polymorphisms » (SSCP) . 

5) Methodes bas€es sur un clivage des regions misappariees 
15 (clivage enzymatique par la SI nuclease, clivage 

chimique par differents composes tels que la piperidine 
ou le tetroxide d* osmium, etc. 

6) Mise en evidence d* heteroduplex en electrophorese . 

7) Methodes basees sur 1 * utilisation en hybridation de 
20 sondes oligonucleotidiques specif iques d* alleles : 

« Allele Specific Oligonucleotide » (ASO) (Stoneking et 
al., 1991). Des exemples de sondes utilisables pour la 
detection de la mutation G.1263mac.A. par ASO figurent 
sur le Tableau 4 . 
25 8) Methode OLA « dual color Oligonucleotide Ligation 
Assay » (Samiotaki et al., 1994), 
9) Methode ARMS ol Amplification Refractory Mutation 
System », ou ASA « Allele Specific Amplification », ou 
PASA « PGR Amplification of Specific Allele » (Wu et 
30 al. , 1989) . 

Cette liste n*est pas exhaustive, et d'autres 
methodes bien connues peuvent etre utilisees. 
Recherche de remaniements , par exemple de type deletions 

D'autres methodes bien connues et basees sur les 
35 techniques d' hybridation a l*aide de sondes genomiques, de 
sondes ADNc, de sondes oligonucleotidiques ou de ribosondes 
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peuvent etre utilis^es pour la recherche de ce type de 
remaniements . 

Font done, ainsi, egalement partie de 
1* invention, les m§thodes de diagnostic d*une 
5 predisposition a des troubles lies a FMO chez un patient 
selon 1* invention, caracterisees en ce que ladite analyse 
est realisee par hybridation, ladite hybridation etant 
realisee de preference a l*aide d'au moins une sonde 
oligonucleotidique specif ique de 1' allele, ou en ce que la 

10 presence d*une mutation est detectee par comparaison avec 
la sequence correspondante naturelle non tnutee, ou en ce 
que ladite analyse est realisee par sequencpage, ou par 
migration electrophoretique, et plus particulierement par 
SSCP ou DGGE, ou en ce que ladite analyse est realisee par 

15 une methodologie visant a detecter une troncation de la 
proteine . 

Font aussi partie de 1* invention, les methodes 
de diagnostic d'une predisposition a des troubles lies a 
FMO chez un patient selon 1' invention, caracterisees en ce 

20 que tout ou partie de la sequence nucleique du gene FMO est 
amplifiee prealablement ^ la mise en evidence de la ou des 
mutations, de preference 1 ' amplification est realisee par 
PGR ou PGR- like, les amorces choisies pour realiser 
1 ' amplification etant de preference choisies parmi les 

25 amorces selon 1* invention. 

Les reactifs pour detecter et/ou identifier une 
mutation du gene F^O dans un echantillon biologique, 
caracterises en ce qu'il comprennent une sonde dite de 
capture et/ou une sonde dite de detection, I'une au moins 

30 de ces sondes comportant une sequence selon 1' invention, ou 
un anticorps selon 1* invention, font egalement partie de 
1 ' invention. 

Methodes basees sur la detection du produit du gene 

Les mutations du gene FMO peuvent etre 
35 responsables de differentes modifications du produit de ce 
gene, modifications utilisables pour une approche 
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diagnostique. En effet, les modifications d ' antigenicite 
peuvent permettre la mise au point d'anticorps specif iques. 
Toutes ces modifications peuvent etre utilisees en approche 
diagnostique, grace ^ plusieurs methodes bien connues 
5 basees sur 1 'utilisation d'anticorps mono- ou polyclonaux 
reconnaissant la proteine normale ou des variants mutes, 
par exemple methode RIA ou ELISA. 

Enfin, il est egalement possible de 
diagnostiquer una predisposition a des troubles lies ^ FMO, 

10 Chez un patient, en mesurant I'activite enzymatique de la 
(ou des) FMO a partir d' echantillons biologiques dudit 
patient. La mesure de cette (de ces) activite{s), par 
comparaison avec un etalon, interne ou externe, sera en 
effet indicative d'une predisposition a I'un des troubles 

15 precedemment cites. 

Compositions thgrapeutioues 

La prSsente invention concerne egalement les 
traitements therapeut iques , curatifs ou preventifs, de 
troubles lies a FMO. 

20 On pourra utiliser les composes impliques 

directement ou indirectement dans I'activite FMO, issus de 
1 * utilisation des modeles cellulaires decrits precedemment. 

On pourra particulierement utiliser les composes 
capables d'interagir avec les FMOs, normales ou variantes, 

25 & titre d'agoniste ou d * antagoniste notamment . 

La presente invention concerne egalement des 
compositions therapeiitiques comportant a titre de principe 
actif un compose capable de moduler I'activite FMO, il peut 
s'agir de composes a activite pro-FMO, notamment tels que 

30 decrits precedemment, ou des composes a activite ant i -FMO. 

De fa<;:on generale, on entendra par compose a 
« activite pro-FMO » un compose qui induira I'activite FMO, 
au contraire un compose anti-FMO aura tendance a reduire 
I'activite FMO. L' effet reel de ces types d*activites 

35 dependra du type d' enzyme exprimee, normale ou 
pathologique. 
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De fagon preferee, on pourra utiliser des 
compositions therapeutiques dont I'activite sera differente 
envers les enzymes FMOs normales et variantes. 

II est tout d'abord possible de prevoir un 

5 traitement de substitution, c'est-a-dire des compositions 
therapeutiques caracterisees en ce qu*elles comportent a 
titre de principe actif un compose a activite pro-FMO ; il 
pourra s'agir notamment de tout ou partie de polypeptides 
tels qu*ils ont ete decrits precedemment , ou bien d'un 

10 vecteur d' expression de ces memes polypeptides, ou bien 
encore de composes chimiques ou biologiques ayant une 
activite pro-FMO, une activite FMO-like ou induisant la 
production de FMO. 

II est possible egalement d* utiliser des 

15 compositions therapeutiques dans lesquelles le principe 
actif aura une action anti-FMO, en particulier anti-FMO 
variante . Dans ce cas il s'agit d*un traitement suppressif. 
II pourra s'agir, par exemple, de composes interagissant 
avec lesdites enzymes, notamment des composes proteiques, 

20 et en particulier d'anticorps anti-FMO, notamment lorsque 
ces anticorps reconnaitront les proteines variantes. II 
pourra s'agir egalement de produits chimiques ayant une 
activite anti-FMO, notamment des antagonist es de FMO 
variante . 

25 Parmi les nombreux composes pharmaceutiques 

utilisables, il faut citer plus particulierement , les 
sequences anti-sens interagissant avec le gene FMO normal 
ou mute, ou bien les sequences sens agissant sur la 
regulation de 1' expression de ces genes, lesdits produits 

30 pouvant egalement interagir en aval des produits 
d' expression induits par les FMOs, 

II faut egalement mentionner les anticorps 
monoclonaux inhibant les FMOs, en particulier les FMOs 
mutees, et/ou inhibant les ligands correspondants et/ou les 

35 produits induits par 1' activite FMO, qui peuvent done avoir 
des activites pro ou anti. 
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II est egalement possible de prevoir 
1* expression de proteines ou leurs fragments in vivo, 
notamment par le biais de la therapie genique et en 
utilisant les vecteurs qui ont ete decrits pr^cedemment . 

5 Dans le cadre de la therapie genique, il est 

possible egalement de prevoir 1 * utilisation des sequences 
des genes ou des ADNc precedemment decrits, « nus », cette 
technique a notamment 6te d^veloppee par la societe Vical, 
qui a montre qu'il etait, dans ces conditions, possible 

10 d'exprimer la proteine dans certains tissus sans avoir 
recours au support d'un vecteur viral notamment, 

Tou jours dans le cadre de la therapie genique, 
il est egalement possible de prevoir 1 ' utilisation de 
cellules transformees ex-vivo, lesquelles pourront etre 

15 ensuite reimplantees, soit telles quelles, soit au sein de 
systemes de type organoide, tel que cela est egalement 
connu dans I'etat de la technique (Danos et al., 1993). On 
peut egalement envisager 1 'utilisation d' agents facilitant 
le ciblage d'un type cellulaire determine, la penetration 

20 dans les cellules ou le transport vers le noyau. 

Ainsi, 1' invention a egalement pour objet une 
composition therapeutique, caracterisee en ce qu'elle 
comporte a titre de principe actif au moins un compose 
capable de moduler I'activite FMO, de preference I'activite 

25 FM02 et/ou FMOx. 

invention comprend egalement une composition 
therapeutique caracterisee en ce qu'elle comporte a titre 
de principe actif au moins un compose capable d'interagir 
avec FMO, de preference capable d'interagir avec FM02 et/ou 

30 FMOx, ou une composition therapeutique selon 1' invention, 
caracterisee en ce qu*elle presente une activite differente 
sur FMO normale et FMO pathologique . 

L' invention comprend egalement une composition 
therapeutique selon 1' invention, caracterisee en ce qu*elle 

35 comporte a titre de principe actif un compose a activite 
pro-FMO, de preference choisi parmi les composes suivants : 
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a) une proteine ou un polypeptide selon 1' invention, 

b) un vecteur d' expression selon 1' invention, 

c) une sequence nucleotidique selon 1* invention, 
caracterisee en ce que ladite sequence est une sequence 

5 sens induisant 1' expression de FMO. 

L' invention conceme en outre une composition 
therapeutique selon 1' invention, caracterisee en ce qu'elle 
comporte ^ titre de principe actif un compose a activite 
anti-FMO selon 1* invention, de preference le principe actif 

10 est choisi parmi les composes suivants : 

a) un anticorps anti-FMO selon 1* invention, 

b) un vecteur d'expression selon 1' invention, 

c) une sequence nucleotidique selon 1' invention, 
caracterisee en ce que ladite sequence est une sequence 

15 antisens inhibant 1* expression de FMO, 

d) une sequence nucleotidique selon 1* invention, 
caracterisee en ce que ladite sequence est une sequence 
sens inhibant 1* expression de FMO. 

L' invention concerne aussi une composition 
20 therapeutique selon 1* invention, caracterisee en ce que le 
principe actif est une sequence soluble interagissant avec 
FMO. 

L' invention a egalement pour objet 1 ' utilisation 
d'un principe actif, de preference au moins un produit 
25 selon 1* invention, capable de moduler ou d*interagir avec 
FMO, FM02 et/ou FMOx, pour realiser un medicament destine 
au traitement et/ou ^ la prevention de troubles lies au 
f onctionnement de FMO. 

Sous un autre aspect, 1' invention est relative a 
30 un precede de biodegradation ou de biosynthese de compose 
organique ou inorganique, caracterise en ce qu'il met en 
^uvre un polypeptide ou une cellule selon 1* invention. 

Les polypeptides a activite FMO selon 
1' invention pourront en effet avantageusement etre utilises 
35 pour biodegrader suivant les reactions d'oxydation, telles 
que dScrites par exemple par Ziegler (Ziegler et al . , 
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1993), les composes substrats de FMO, en particulier les 
composes tels que cites dans la presents description, ou 
etre utilises pour la biosynthese de compose d'int^ret a 
partir desdits composes substrats de FMO, notamment pour la 

5 biosynthese de medicament, d*additif alimentaire, de 
pesticide ou d* herbicide. 

Les precedes d' elaboration de compose d'interet, 
caracterises en ce qu'ils utilisent un polypeptide ou une 
cellule selon 1* invention, font bien entendu partie de 

10 1* invention. Les polypeptides ou cellules selon 
1' invention, pourront en effet avantageusement etre 
utilises in vitro pour determiner la metabolisation 
potentielle du compose d*interet et pour analyser les 
metabolites eventuellement obtenus, leur toxicite et/ou 

15 leur activite. Les resultats obtenus permettront de 
confirmer le compose ou de le reformuler de maniere a ce 
qu'il devienne ou pas substrat de FMO, ou a ce que les 
metabolites formes soient differents. 

Les produits susceptibles d'etre obtenus par 

20 ledit precede de biosynthese, font egalement partie de 
1 * invention. 

Enf in, 1 * invention comprend 1 ' utilisation de 
polypeptide ou de cellule selon 1' invention, pour la 
detoxification de compose x^nobiotique, substrat de FMO. 
25 Ces composes xenobiotiques peuvent etre presents dans 
1 ' environnement , tels que pesticide ou herbicide, presents 
naturellement dans les plantes comme certains alcaloides, 
ou peuvent correspondre a des composes pharmaceutiques . 

30 D'autres caracteristiques et avantages de la 

presente invention apparaitront a la lecture des exemples 
ci-apres, faite en se referant aux dessins annexes 
suivants : 

- Figure 1 : Sequence polypeptidique correspondant a 
35 la sequence SEQ ID N° 3 prSdite de hFM02, homologue humaine 
de la FM02 de macaque. 
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- Figure 2 : Sequence nucleotidique correspondant 
partiellement a la sequence SEQ ID N° 1 du gene codant pour 
hFM02, homologue humaine de la FM02 de macaque. 

Au vu des homologies des ARN messagers connus de genes 
5 de la famille des mono -oxygenases a flavine, ces genes 
partagent la meme structure exon/intron : 

exonl : non traduit, variable en taille et en 

sequence, 

exon2 : debut de la region codante, code pour les 
10 acides amines 1-44, 



exon3 
exon4 
exonS 
exon6 
15 exonV 
exonS 
exon9 



acides amines 45-107, 
acides amines 108-161, 
acides amines 162-209, 
acides amines 210-275, 
acides amines 276-394, 
acides amines 395-419/ 

acides amines 420-535, fin du codant et region 
non traduite 3 • . 

Les introns sont variables en taille et en complexity . 
20 Nous avons d'abord isole la sequence de trois fragments du 
BAG 123H04M qui contiennent la totalite des exons de cet 
homologue , 

Fragment 1 : contenant les exons 1 et 2, 
Fragment 2 : contenant 1 ' exon 3 , 
25 Fragment 3 : contenant les exons 4 a 9 . 

Les sequences de deux introns ont ensuite ete 
completees. 

- Figure 3 : 

Figure 3A : Description de la structure exon/intron du 
30 gene codant pour hFM02, homologue humaine de la FM02 de 
macaque . 

Sont indiquees les positions des debuts et fins 
d' exons sur les sequences nucleotidiques SEQ ID N° 1 et 
N*> 2. 

35 Figure 3B : Description de la structure exon/intron du 

gene codant pour hFMOx. 
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Sont indiqu^es les positions des debuts et fins 
d*exons sur les sequences nucleotidiques SEQ ID N** 4 et N° 
5. 

- Figure 4 : Homologie entre le gene FM02 de macaque 
5 et son homologue humain tel que prSsente en figure 2. 

La region 5 ' non traduite diverge legeretnent de la 
sequence de macaque tel que presente en figure 2 . 

- Figure 5 : Releve des positions variantes de la 
sequence de I'ARNm de hFM02 humain par rapport a la 

10 sequence homologue de macaque ; influence des variations 
sur la sequence proteique. 

- Figure 6 : Homologies entre les sequences d'ARMm de 
la FM02 de macaque et de son homologue humaine. 

La position de la mutation G.1263mac.A est reperee par 
15 une fleche verticale. 

Figure 7 : Homologies entre les sequences 
peptidiques de la FM02 de macaque et de son homologue 
humaine . 

Figure 8 : Analyse de la segregation du 
20 polymorphisme G.1263mac.A dans la famille etudiee. 

L'ADN genomique des individus 3, 4, et 7 a 14 a ete 
amplifie par PGR, et la sequence des fragments obtenus 
analysee pour detecter des sites d ' heterozygotie 
segregeant avec la maladie. 
25 Les symboles pleins indiquent les individus atteints 

du GPAO juvenile. Les symboles barres indiquent des 
individus non genotypes. Les individus 11 et 12 sont 
des jumeaux. 

G/G = homozygotes pour la base en position homologue 
30 de la position 1263 de I'ARNm de la FM02 de macaque. 

G/A = heterozygotes pour la base en position homologue 
de la position 1263 de I'ARNm de la FM02 de macaque. 

- Figure 9 : Localisation chromosomique du BAC123H04M 
par hybridation in situ f luorescente . 

35 (A) Un signal specifique est observe sur les deux 

chromosomes 1. Sur la photo (B) est represente un seul 
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des deux chromosomes.!. En (C) , seules les bandes R de 
ce chromosomes sont observees, montrant que le signal 
de la sonde 123H04M est localise sur la bande lq23 . 
- Figure 10 : Sequence nucleotidique correspondant 

5 partiellement a la sequence SEQ ID 4 du gene codant pour 
1 • isof orme hFMOx humaine . 

Ce gene presente un taux d'homologie de 75 % en ADN et 
de 70 % en acides amines avec les ARNs messagers de 
mono -oxygenases a flavine presents sur le BAG 123H04M. 

10 II est presente, dans cette figure preliminaire, en 

quatre fragments : 
. fragment 1 : code pour l*exon 2 (premier exon codant), 
fragment 2 : exon 3, 
fragment 3 : exons 4 a 8, 

15 fragment 4 : exon 9 . 

EXEMPLES 

Isolement du BAG 123H04M 

Afin d* identifier un gene codant pour une nouvelle 

20 FMO, on a isole un BAG (« Bacterial Artificial Ghromosome 
correspondant a la region candidate precedemment localisee 
sur le chromosome 1 . Une banque de BACs couvrant le genome 
humain complet a ete preparee a partir de I'ADN d'une lignee 
lymphoblastique humaine derivee de 1 ' individu n° 8445 des 

25 families du CEPH. Gette lignee a ete utilisee comme source 
d*ADN de haut poids moleculaire. L*ADN a ete partiellement 
digere par 1' enzyme de^ restriction BamHl, puis clone au site 
BamHl du plasmide pBeloBacII. Les clones ainsi obtenus ont 
ete « pooles » et cribles selon une procedure d' analyse 

30 tridimensionnelle precedemment decrite pour le criblage des 
banques de YAGs (« Yeast Artificial Ghromosome » ) (Ghumakov 
et al., 1992). Les pools tridimensionnels obtenus ont ete 
cribles par PGR a I'aide des amorces encadrant le marqueur 
D1S3423 (WI-10286) . Ge STS (« Sequence Tagged Site ») avait 

35 ete precedemment localise dans la region candidate, Un clone 
du BAG 123H04M a ete ainsi isole. 
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Apres digestion par 1* enzyme de restriction NotI, 
la taille de 1 ' insert porte par ce BAG a ete determinee sur 
un gel d' agarose 0,8 % apres migration par electrophorese en 
champ alterne (CHEF) (4 heures a 9 Volts/cm, avec un angle 

5 de 100°, a ll^C en tampon 0,5xTAE). On a ainsi mis en 
Evidence que le BAG 123H04M porte un insert de 180 kb. 
Localisation chromosomique du BAG 123H04M par hybridation in 
situ fluorescente (FISH) 

La localisation chromosomique du BAG dans la 

10 region candidate Iq23-q25 a ete confirmee par hybridation in 
situ fluorescente (FISH) sur chromosomes metaphasiques, 
selon la methode decrite par Gherif et al . , 1990. Le BAG 
123H04M a ete localise plus precisement dans la bande lq23 
du chromosome 1 (Figure 9) . 

15 Seauenqaqe de 1' insert du BAG 123H04M 

Afin de sequencer 1 ' insert du BAG 123H04M, on a 
prepare trois banques distinctes de sous clones a partir de 
1*ADN Sonique de ce BAG. 

Apres incubation une nuit, les cellules issues de 

20 trois litres de culture ont ete traitees par lyse alcaline 
selon les techniques classiques. Apres centrif ugation du 
produit obtenu dans un gradient de chlorure de cesium, 52 /xg 
d'ADN du BAG 123H04M ont ete purifies. 7 /xg d'ADN ont ete 
soniques dans trois conditions differentes, afin d'obtenir 

25 des fragments dont les tailles se distribuent uniformement 
de 1 a 9kb- Les fragments obtenus ont ete traites dans un 
volume de 50 fil avec 2 unites de Vent polymerase pendant 20 
minutes a 70**G, en presence des 4 deoxytriphosphates 
(100 fiM) . Les fragments aux extremitSs franches resultant de 

30 cette etape ont ete separes par electrophorese en gel 1 % 
d* agarose a bas point de fusion (60 Volts pendant 3 heures) . 
Les fragments groupes selon leurs tailles ont ete excises et 
les bandes obtenues traitees par 1 ' agarase . Apres extraction 
au chloroforme et dialyse sur colonnes Microcon 100, I'ADN 

35 en solution a ete ajuste a une concentration de 100 ng//il. 
Une ligation a ete effectuee, incubation une nuit, en 
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mettant en presence 100 ng de I'ADN fragmente du BAG 123H04M 
et 20 ng d'ADN du vecteur lin6aris§ par digestion 
enzymatique, et traite par la phosphatase alcaline. Cette 
reaction e ete realisee dans un volume final de 10 fil en 
5 presence de 40 unitgs//xl de T4 ADN ligase (Epicentre) , Les 
produits de ligation ont ensuite servi a transformer par 
electroporation, soit une souche XL-Blue (pour les plasmides 
multicopies) , soit une souche DIOHB (pour les sous clones 
issus du BAG) . Les clones lacZ" et resistants a 
10 1 ' antibiotique, ont ete repiques individuellement en 
microplaques pour stockage et sequenqrage. 
On a ainsi obtenu ; 

- 864 sous clones issus de 1' insertion de fragments de 2 a 
3 kb au site Smal du plasmide pucl8 ; 

15 - 1728 sous clones correspondant a 1 ' insertion de 
fragments de 1,5 a 2 kb au site BamHI (rendu franc) du 
plasmide BluescriptSK ; 

- 288 sous clones portant des fragments de 4 a 7 kb 
inseres au site Pmll d'un vecteur BAG modifie. 

20 Les inserts de ces sous clones ont ete amplifies 

par PGR sur cultures bacteriennes incubees une nuit en 
utilisant les amorces des vecteurs flanquant les insertions. 
La sequence des extremites de ces inserts (en moyenne 500 
bases de chaque cote) a ete determinee par sequengage 

25 automatique fluorescent sur sequenceur ABI 377, equipe du 
logiciel ABI Prism DNA Sequencing Analysis (version 2.1.2). 

Les fragments de sequence provenant des sous-BAGs 
ont ete assembles par le logiciel Gap4 de R. Staden 
(Bonfield et al . , 1995). Ge logiciel permet la 

30 reconstruction d'une sequence complete ^ partir de fragments 
de sequences. La sequence deduite de I'alignement des 
differents fragments est la sequence consensus. 

On a enfin utilise des techniques de sequengage 
dirige (marche systematique de 1' amorce) pour parfaire les 

35 sequences et relier les contigs. 
Analyse des sequences 
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Les exons potentiels du BAG 123H04M ont ete 
repSres par recherche d'homologie sur les banques publiques 
de proteines, d'acides nucleiques at d'EST (Expressed 
Sequence Tags) . 

5 Banques de donnees ; 

On a utilise des refontes locales des principales 
banques publiques. La banque de proteines utilisee est 
constitute par la fusion non redondante des banques Genpept 
(traduction automatique de GenBank, NCBI ; Benson et al,, 

10 1996) ; Swissprot, (George et al . , 1996) ; et PIR/NBRF 
(Bairoch et al., 1996). Les doublons ont ete elimines par le 
logiciel "nrdb" (domaine public, NCBI ; Benson et al., 
1996) . Les repetitions internes ont ensuite ete masqu6es par 
le logiciel « xnu » (domaine public, NCBI ; Benson et al., 

15 1996) . La banque resultante, denommee NRPU (Non -Redundant 
Protein- Unique) a servi de reference pour les recherches 
d* homologies proteiques. Les homologies trouvees avec cette 
banque ont permis de localiser des regions codant 
potentiellement pour un fragment de proteine au moins 

20 apparente a une proteine connue (exons codants) . La banque 
d'EST utilisee est composee des sous-sections « gbest » (1- 
9) de Genbank (NCBI ; Benson et al . , 1996). Elle contient 
tous les fragments de transcrits publics. 

Les homologies trouvees avec cette banque ont 

25 permis de localiser des regions potentiellement transcrites 
(presentes sur I'ARN messager) . 

La banque d'acides nucleiques (autres que les EST) 
utilisee contient toutes autres sous -sections de Genbank et 
de 1»EMBL (Rodriguez -Tome et al., 1996) dont les doublons 

30 ont ete elimines comme precedemment . 
Loaiciels : 

On a utilise 1* ensemble de logiciel BLAST (domaine 
public, Altschul et al . , 1990) de recherche d'homologies 
entre une sequence et des banques de donnees proteiques ou 
35 nucleiques. Les seuils de signification dependent de la 
longueur et de la complexity de la region testee ainsi que 
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de la taille de la banque de reference. lis ont ete ajustes 
et adaptes a chaque analyse . 

Identification de polvmorphismes genetigues associ6s au FMO 
en relation avec un polymorphisme phenotypigue associe a la 
5 survenue du glaucome juvenile GPAO-J. tnaladie Hp 
transmission autosomale dominante (locus GLCIA) 

Detection de Polymorphismes /Mutations 
1) Extraction de I'ADN 

L*ADN est extrait du sang veineux peripherique 
10 apres lyse cellulaire, digestion proteique, partition 
organique et finalement precipitation alcoolique. 

Le sang (20 ml) est preleve par ponction veineuse 
peripherique sur un tube contenant de I'EDTA. 

II est dilue avec un volume d'eau bidistillee. 
15 Apres 10 minutes, les cellules sont collectees par 
centrifugation S 1600 g pendant 10 minutes. Cette 
manipulation est repetee. 

Les cellules blanches sont lysees en presence de 
20 ml de tampon CLB (Tris 10 mM pH 7.6, 5 mM MgCl2, sucrose 
20 0 - 32 M, Triton X-100 1 % (v/v) . Les noyaux sont collectes 
par centrifugation a 1600 g pendant 10 minutes. Cette 
manipulation est repetee. 

Les noyaux sont laves une fois dans le tampon RSB 
(Tris 10 mM pH 8, NaCl 10 mM, EDTA 10 mM) , Le culot est 
25 resuspendu dans 2 ml de tampon RSB auquel est ajoute du 
lauryl sulfate de sodium (1 %) et la proteinase K 
(200 mg/ml) . Le melange est incube a 55 °C pendant au moins 3 
heures et regulierement agite. 

La solution d'ADN ainsi obtenue est ensuite 
30 extraite avec un volume de phenol equilibre avec un tampon 
50 mM Tris pH 8. Cette operation est repetee et completee 
par une extraction avec un volume de chloroforme /alcool 
isoamylique (24 : 1 v/v) . 

L'ADN est precipite avec un volume d' isopropanol , 
35 rince a l»ethanol (70 %) , seche et enfin resuspendu dans 
1 ml de tampon TE (Tris 10 mM pH 8, EDTA 0.5 mM) . La 
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concentration d*ADN est evaluee par mesure de I'absorbance a 
260 nm en utilisant 1 ' equivalence de 50 ;ig/ml d'ADN pour une 
unite d ' absorbance . La concentration d'ADN est alors ajustee 
a 200 /xg/ml. 

5 2) Amplification de I'ADN genomique 

Les amorces oligonucleotidiques utilisees pour 
1 ' amplification genomique des sequences exoniques derivees 
du BAG 123H04M, telles que predites par analyse 
informatique, ont ete definies a l*aide du logiciel OSP 

10 (Hillier et al . , 1991). 

Toutes ces amorces contiennent, en amont des bases 
specif iquement ciblees par 1 ' amplification, une queue 
oligonucleotidique commune, destinee a permettre le 
sequen^age des fragments amplifies (PU pour les amorces en 

15 amont, et RP pour les amorces en aval ; sequences exposees 
sur le Tableau 5) . 

Les amorces oligonucleotidiques ont ete 
synthetisees selon la methode des phosphoramidites, sur un 
synthetiseur GENSET UFPS 24.1. 

20 L» amplification de chaque sequence exonique predite 

a ete realisee par reaction d' amplification en chaine par 
polymerase (PGR) , dans les conditions suivantes : 



Volume final • 50 /il 

ADN genomique 100 ng 

25 MgGl2 2 mM 

dNTP (pour chacun) 200 /xM 

Amorce (pour chacune) _ 7.5 pmoles 

AmpliTaq Gold DNA polymerase (Perkin) 1 unite 

* Tampon de PGR 1 X 



30 * :(10X=0.1 M Tris HGl pH 8.3, 0.5 M KGl) 

L' amplification est realisee dans un thermocycleur 
Perkin Elmer 9600 ou MJ Research PTC200 avec couvercle 
chauffant. Apres un chauffage a 94*>C pendant 10 minutes, 35 
cycles sont effectues. Ghaque cycle comprend : 30 secondes a 

35 94 °G, 1 minute a 55 °G et 30 secondes a 72 ®G. Un segment 
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final d'elongatipn de 7 minutes a 12^ C termine 
1 ' amplification. 

La quant ite de produits d' amplification obtenue 
est determinee sur micro-plaque de 96 puits, par 
5 f luorometrie, utilisant 1' agent intercalant Picogreen 
(Molecular Probes) . 

3) Detection des polymorphismes/mutations 
- Sequence 

Les produits de 1 • amplification genomique par 
10 PGR ont ete sequences sur sequenceur automatique hBl 377, en 
utilisant des amorces f luorescentes marquees par les 
f luorochromes ABI (Joe, Fam, Rox et Tamra) et 1*ADN 
polymerase Thermosequanase (Amersham) . 

Les reactions ont €t6 realisees en microplaques 
15 de 96 puits, sur thermocycleur Perkin Elmer 9600, dans des 
conditions classiques de cycles de temperature : 

- 8 cycles : denaturation : 5 sec. a 94®C; hybridation : 10 
sec. ; elongation : 30 sec. a 72*^0, puis 

- 13 cycles ; denaturation : 5 sec. a 94**C; elongation : 30 
20 sec. a 72°C. 

6 unites de Thermosequanase, et 5-25 ng de produit 
d' amplification ont ete utilisees par reaction de sequence. 

A 1 ' issue des cycles d' amplification, les produits 
des reactions de sequence sont precipites dans I'ethanol, 
25 resuspendus dans du tampon de charge contenant de la 
formamide, denatures, et deposes sur gels d'acrylamide 
4 % ; les electrophoreses (2 heures 30 a 3000 Volts) sont 
conduites sur sequenceurs ABI 377 equipes des logiciels ABI 
de collection et d' analyse (ABI Prism DNA Sequencing 
30 Analysis Software, version 2.1.2.). 

- Analyse des sequences 

Le GPAO-J etant une maladie autosomale dominante, 
les donnees de sequence obtenues ont ete analysees afin de 
detecter la presence de sites d'heterozygotie parmi les 
35 patients atteints de glaucome juvenile. Les sites 
d'heterozygotie ont ete confirmes apres comparaison des 
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sequences des deux brins d'ADN genomique de chaque individu 
concerne. Un site d* h^terozygotie est retenu comme mutation 
candidate responsable de la survenue de troubles lies a FMO 
s'il est present dans une population de membres d*une meme 
5 famine, alors qu'il est absent en general chez les 
controles non apparentes a la famille. 
- Resultats 

Parmi tous les fragments d ' amplification derives 
du BAG 123H04M etudies, l*un d*entre eux presente un site 

10 d'heterozygotie segregeant avec la survenue du glaucome 
juvenile dans un pedigree repr^sente sur la Figure 8. 

Ce site d ' heterozygotie (G/A) est present chez 7 
patients atteints de GPAO-J tandis qu'il est absent de 3 
patients sains homozygotes (G/G) , tous issus de la meme 

15 famille. De plus, 99 controles non apparentes sont de meme 
homozygotes (G/G) pour ce site, indiquant que la frequence 
de 1' allele A dans la population generale est inferieure a 
0.005. 

Le site est contenu dans 1 ' exon 8 du gene codant 
20 pour la proteine hFM02 selon 1* invention ; la mutation 
decrite transforme 1 ' acide glutamique en position 402 de la 
sequence SEQ ID 1 de la hFM02 en lysine (Figure 1) . 

II est surprenant de remarquer que le calcul des 
lod scores integrant les donnees precedentes pour 
25 differentes hypotheses de frequences de chaque allele dans 
la population genSrale, indique une probabilite superieure 
a 100 centre 1 que 1^ heterozygotie (G/A) decrite soit liee 
au GPAO-J (Tableau 6) . Cette probabilite est significative 
du fait que 1 ' analyse a porte sur une seule famille. 
30 Les amorces ayant permis 1 ' amplification du 

fragment d'ADN contenant ce site d' heterozygotie sont 
decrites dans le Tableau 1, 

Tableau 1 : Sequences des amorces utilisees pour amplifier 
35 la region exonioue derivge du BAG 123H04M et contenant un 
site d' heterozygotie lie au GPAO juvenile 
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Locus du fragment : FM02/Exon 8 
Taille du fragment amplifie : 420 

Amorces: Amont PU (SEQ ID N°7) : 5 ' TCACATAGAGTGCTATGGGGG 

Aval RP (SEQ ID N^S) : 5 » CTTAGGAAGAAGATAAAAATGCAAC 
5 Tableau 2 : Exemples d' amorces pour detecter la mutation 
G.1263mac.A par « Single Nucleotide Primer Extension » 

a) SEQ ID N<>9 : 5» AATGTCCATCATCATAGTTCTCT 3' (antisens) 

et/ou 

b) SEQ ID N°10 : 5' TAGGCTTGTGTAGCCTGCCCTCA 3* (sens) 



10 



15 



25 



30 



35 



Tableau 3 : Identification de la mutation G,1263mac.A par 
RFLP 



5' c qCTCAC^ GAGAA 3' <c normal » 



site Ddel (C TNAG) 



CCCTCAaAGAGAA 3 * « mutant » 



20 pas de coupure 

Tableau 4 : Exemple de sondes pour la detection de la 
mutation G.1263mac.A. par la technique ASO 
Specif ique de 1' allele G 



SEQ ID NO 11 : 5' CCTCAgAGAGAACTAT 3' et sa 

complementaire : 

SEQ ID NO 12 : 3» GGAGlj^TCTCTTGATA 5' 

Specif ique de 1* allele A 

SEQ ID NO 13 : 5» CCTCA@AGAGAACTAT 3' et sa 

complementaire 

SEQ ID NO 14 : 3' GGAGTTTCTCTTGATA 5* 
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Tableau 5 : S^cmence des amorces utilisees pour le 
seauencaqe des fragments d' amplification a parbir d'ADN 
genomicrue 

PU 5' TGTAAAACGACGGCCAGT 

RP 5' CAGGAAACAGCTATGACC 



Tableau 6 : Lod score entre le polvmorphisme G.1263mac.A et 
le GPAO juvenile dans la famille etudiee en fonction de la 
frequence des deux alleles dans la population qenerale. 



Frequence de 1 * allele 
rare (A) 


0 (taux de 
recombinaison) 


Lod score 


0.01 


0 


2,07 


0,001 


0 


2 .10 


0,0001 


0 


2 .10 


0 .00001 


0 


2 .10 
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SEQUENCE LISTING 



SEQ 


ID 




1 


SEO 


ID 


N° 


2 


SEO 


ID 


N° 


3 


SEO 


ID 


N° 


4 


SEO 


ID 


N® 


5 


SEQ 


ID 


N° 


6 


SEQ 


ID 


N** 


7 


SEQ 


ID 


NO 


8 


SEQ 


ID 


NO 


9 


SEQ 


ID 


NO 


10 


SEQ 


ID 


NO 


11 


SEQ 


ID 


NO 


12 


SEQ 


ID 


NO 


13 


SEQ 


ID 


NO 


14 
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LISTE DE SEQUENCES 



{!) INFORMATIONS GENERALES : 

(i) DEPOSANT: 

(A) NOM: GENSET 

(B) RUE: 24 RUE ROY ALE 

(C) VILLE: PARIS 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 75008 

(ii) TITRE DE L' INVENTION: SEQUENCE NUCLEOTIDIQUE CODANT POUR UNE 
FLAVINE MONOOXYGENASE, PROTEINE CORRES PON DANTE ET LEURS 
APPLICATIONS DANS LE DOMAINE DU DIAGNOSTIC ET 
THERAPEUTIQUE 

(iii) NOMBRE DE SEQUENCES: 14 

(iv) FORME DECHIFFRABLE PAR ORDINATEUR: 

(A) TYPE DE SUPPORT: Floppy disk 

(B) ORDINATEUR: IBM PC compatible 

(C) SYSTEME D* EXPLOITATION: PC-DOS/MS-DOS 

(D) LOGICIEL: Patentin Release #1.0, Version #1.30 (OEB) 

(vi) DONNEES DE LA DEMANDE ANTERIEURE: 

(A) NUMERO DE LA DEMANDE: FR 9615032 

(B) DATE DE DEPOT: 06-AUG-1996 



(2) INFORMATIONS POUR LA SEQ ID NO: 1: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 26016 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: double 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: ADN (genoraique) 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 1: 



CATCAGTTAT 


CCCTGGAGGA 


TAACTAAGCC 


ATCTGCCTCC 


ATCATCTTTT 


AAGGGTTCAG 


60 


TCAGTTTAAA 


ACTTTGCTTC 


TATACCTAGG 


TATTTTCTTT 


TCTCTGTATG 


TTGGTCAGGT 


120 


ACAATTATTT 


TTAACAGGGC 


TTCCATCAAT 


ATCATAACTA 


CCTAGAGAAG 


ACATTGCAAA 


180 


GATAAAATTG 


GAGAATTGTT 


AACAGGCTGT 


TAACAAAATG 


TGTACCCAAC 


TGCCAATGAA 


240 


GTGGCTTGAT 


TTTTTTCTTT 


TTTTAAAATT 


TTTCTTTTGT 


ATCCTTTTAT 


TTTATTTACT 


300 
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TATTTTTTAG AGACACAGTC TCGCTCTGTT ACCCAGGCTG GCGTACAATG GCACAATCAT 360 

AGCCCACTGC AGTCTCGACC TCCAGGGCCT CAAGCAATCC TCCCACCTCA GCCTTCCAAG 4 20 

TAGCTGAGAC TACAAGTGCA TGCTGCCATG CCTGACTGAT TTTTTGTTTT TTGCAGAGAT 4 80 

GAAGTCTCAC TATGTTGCCC AGTCTGACCT TGAACTCCTA GCAATACCCT ACCCTGGCCT 540 

CCCAAACTGC TGGGATTACA GGCATGAGCC ACTGTGCCTG GCCTTTTTTC ATTTTAACTG 600 

AGAAATGTGT TCAGCTCTTT TGTTCCTTAG TCATTGATCA TCACTTTTGT TATATCTGTT 660 

AGTCTTGTCA TAGAGTTGCT GCACTTATTA CACAGAGAAG GCCTTTTATC ACGACCAATT 720 

TATTTTAGGA AATTTCAGGG AAAACGTTTT TCTAGAACAC CTTATTTGAC ATTATAAAAC 780 

AACTCTTCAC TCTTGCACTC CAGACCTCCC TTTCCAGTTT TCTTTTTCTC CATAGTGGTC 840 

ATCACCACTT GTTTTATTTT ATTGATGGGC TGTCTGGCTC CCTCAACTGC AAAGTAAACT 900 

CCACAAAGGC AGAGAGTTTT GTCTCTTTTA TTCATTGCTG TACCTGCATC ACTTAGAAAG 960 

TTTCTGGCAC CTAGGAAGTG TTCAGTAAAT ATTTATTGAA TAAGTTTATG TAAAACGTCT 1020 

CAGACTCCTT AGAGAAACTG GTCTTTTGGG GTTGGAGAAT AAAGTTCTTT ACCTCATCAG 1080 

TTAGACTCTA TCTAAGGTAC ACGAGGGCTT GCTAGTCTCC TAAGTTAGTC TGCTAATAAA 1140 

TGTTAACCCT AATAACTGAA ATTATTAGCA GAGGTAATTA TCCAGTTCTA TATCAAGGCA 1200 

AAAAGACAGC AGTGGATAGA AAGATCTTAG AAGTCCCACT AGGTTCATCC AAGCCACCAT 1260 

ACACATAGGC AGAAAAATCA AAATAAGATA TGAGCCTGGA CAGGGTGAGC AATCTGGGAA 1320 

AAGATGAACA CAGTATGCTA GGACCCAGAA ATCATCAAGT CTATGAAAAC TAAGCCAGAA 1380 

CACAAATGTG AATTCCATAA GATCAGGAAC ATAATCTGTC TTGTTCATCC AGGCATGGTA 14 4 0 

ATCTGCCAGA AATAGTGCTT AACTGCAAGA ACTGAATATT TGTTAGATAA TTAAACCATC 1500 

AACTAAATGA GATTCATGCA ACCATGAAAA ATGCTGCTAT AGGTACACAA TATTGATATA 1560 

CTAGAAAGTT AAAAAATCAA GTTGGAAATT AGACTATTCC ATTTCTGTTT GTGTGTATGT 1620 

ATCTACAAAT AGGTGGAAGG ATATACC7WVA ATGTCAACAG CAGTTACCTC TGGGTGGTGA 1680 

GGAGTAATCT TAACCTTGTT ATTTATCCCT ATATGTTCAT TTGTGAATGA ATATTTATTA 1740 

CATCATTATA AAi\AGGATTT TTAAACTATC TGTATGTTTA AGAGTATATG TTGCTACTAT 1800 

GTAAGAGTAT ATGCTGTTAC TGTAAAGACA TTGCATTACT ACTGTTGACC TCAGAGCACG 1860 

CGCCTCTTGC CTAATTCTAG GACTCCTAAC TAAGTCTTTG GAGTTTCAGC TGGAAGAATG 1920 
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CTGGAGGAAT ACGGAACTCC TCCCATTTCT CACAGCCACC TCCAACTCTT AAAAACGCTT 1980 

CCAACTGCCT CCCAGCACAC AACCAAGGGA GAAAACTATT CTGTCAAAGA GACGGTGCCA 2040 

AAAGGCAAAA ACAAAGGTAA GGATGATCGC TGGGGAAAGA AGCTGAAAAG GAAAAGCTCA 2100 

GAACTCTAGC TGGAAATTTG GCTCACATCC CTAGTATGTT ACT6CATAGT CTGGCTTTGT 2160 

TCAATGGGTC GCTTTTAAAT ATTAAAGCTA GATGTAAGCA AGGTTTGCAA CAAAGTCCAT 2220 

AAGAAACTCA GCTTTTCTCA AAGGCAAGAA GAGAGCAGGA TTTTTGACTG GCTCTTTATT 2280 

CAATAGTGCT GCTTATTAAA TTACCACTGC TACAATGTTT AAAGCCAATT ACCTGAGCAC 2340 

ATCATAAGGA TTCTCTTACC GGTTGTCCCA GTTAAGTAAT GTTGATTGAT CAACTCCTTG 2400 

ACAGGAGCTG ATGGCAAAGA AGGTAGCTGT GATTGGAGCT GGGGTCAGTG GCCTAATTTC 24 60 

TCTGAAGTGC TGTGTGGATG AGGGACTTGA GCCCACTTGC TTTGAGAGAA CTGAAGATAT 2520 

TGGAGGAGTG TGGAGGTTCA AAGTAAGTGA GATTTTCTTG GGTCTTGAAC AGGTTGTGTT 2580 

GTTATTTCAG GGTGAATCAC AGTTACTGAT GGGTCATATT GAGAAATTTA TTAAACAACT 2640 

CTGATCAGAT TTTATTTCTA TTTATTGATG TGGCCATAAT GGAACTGAAG TCATAGGCTG 2700 

GCATCTCTCC CCCAGTCAAT ACTAACCCAA CCCAGGTAGC TGACCCAGGC ATGTAAAAGA 27 60 

TCTCTTCTTT TGGATTCAGC AATTGTCTTA CAGCCCATAC TTCTGTCATT CTTTAATACG 2820 

CTAATATTAG AGAACATTTT ACAAAAATAG AAGTAACAGG GATTCTTCTC AAGATATCAC 2880 

TTCTGTTTCA ATTATTAAAC CAAATGCTTC TTTAGAGACC ATGCTCTTAT CATTACTATT 2940 

TTTCTCTGAC AAATGAAGCA TGTTTGTTTA CTGAGCTTTA TCAATGACAT TCTAGTATAA 3000 

CTGCTGTG7\A ACTCTTTGTT AAATATGTTT TATTAAATTT ATTCTATTAA TCAAACCAAA 3060 

ATATTGATAA TGCTATTTGT CTGTATTAGT CCATTCTCAT GCTGCTATGA AGAAATACTG 3120 

AGACTGGGTG ATTTATAAAG GAAAGAGGTT TAATTGACTC CCAGTTCCAC AATGCTGGGG 3180 

AGGACTCAGG AAATTTACAA TCATGGCAGT £GGAAAGAGA GGTGCTGAGC AAAGGGGGAA 324 0 

AAGCCCCTTA TAAAACCATC AGATCTCATT AGAACGCACT CACTATCATG AGAACAGCAT 3300 

GAGGGTAGCT GCCCCCTTGA TTCAATTACC TACCCCCACC AGGTCCTTCC CAAGACATGT 3360 

GGGGATTGTG GGAACTACAA TTCAATATGA GATTTGGATG GGGACACAAA GCTAAACCAT 3420 

GTCACTGTCC TTAAAAATTT GTATAAAACT TAGAAAGTTG CATAGATAGC TATAAGGAGT 34 80 

TACAATTATT CCTTCCCACA ACCTCTCAAT AGGTAGTAGC TTACCACCTT CTAGCTGTGA 354 0 
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GATCTTGAGC AAGTTATTTA CATCCTGTGT TTCAATTTAC TCAGTTATAA ATGGATATAA 3600 

TAACAGGAAA GTGTGATTAT CTCATAGTGC TATTTTGAAG ATTAAGGGAG ATAATTCATA 3660 

TAAAGAACTT AGATAAGTTC CGGACTCATA GAGTTCAATA AATGTTAGCT ACTAATAATA 3720 

ACTATATATT TTATAGATGA GCAAACTGAA AGTGAGGGAG GTTAAGTGAG ATGGCCAGGG 3780 

CCACACAACT GGAGGAACTG GCCTTCAAAC CACGGCCTAC GTGACTTCTA AACAGATAAG 384 0 

CCCTGACTTA CAACCATGCC CTAACTTGCA TTCTTGCTCA AAAAGATTAA ACAAAAGTTT 3900 

AAGTTCAGAA CCCAAAAGCA ATGACTTTAG AATTATGTAA TCAGGTATCC CTGAGATATT 3960 

AAAACACATA AGAATATTCC AAATGGGAGC AAAAGGTTTG AATACATGAA AATCAAACTC 4 020 

ATATCAGCAG AGACCATATA AAGGGCTCTC ACTGCAGGCT GACTAGTTAG GAGGATGGCA 4080 

AGGTGATCCA GGACCTGCGC ATGCTTTGTC AGTTCAAATT GAATCTCATG CCAACAGCGA 414 0 

TCTTTTTTAA CATGTAACAT TAGGTGTCTC AGGTACACAT GACCATAAAC CACACCTGGA 4200 

GGGTTTCTTT TATTTTCTTT TTAATATTTT TCTGAGACAG GGTCCTACTC TGTCACCCAG 4260 

GCTACCATGC CCAGCCATGG AGAGTTTCTT AAAGATACTG ATTCCTTTGG TTAAACCTGC 4320 

CACCAAAAAA AAAAAAAAAA AAAAAAAAAA ATACTGATTT GTGGGCACTC CATCCCAAAT 4380 

CTATGGAATC AAAATCTTCT GGGGGTTTTT AATAAACATC TCAAATGAAT CCTATGATAA 4 44 0 

GACAAATTTG GTAATTGTTA CACAAACACC TAATTTAAAA ATCTGATCAT TCTACTATCT 4 500 

AAACACACTC AGAGTTAATG AGGGAGAAGG GAGAAATTGA TTCTTCTGTA AGACAGGTAG 4 560 

CTTTGCAAAA AGGAAAACAG CTTAAATCAC ATTCATTTCT TATTAAAAGC TGATGATTAA 4 620 

TATCATTTTA GTTTTTCCTG GGATGGTGAT ATAATATGGT GGTCATTCCT GTCTTAACCA 4 680 

AAGATATTTT TGTCCACTCT AGGTTCACAT GTAGATTTCA GCTGGAATTT XTTTTTTTTT 474 0 

TTTTTTTTGC TCCCAGGTAG ATTCTTAACC TAAACAAGAA ATGTAGAAAT TACAGTTGGT 4800 

CCTTGGTATA TGCAGGAGAT TGGCTCCACA ACCTCCCTCC CCCAGTATAC CAAAATCCTT 4 860 

GCATACTCAC ATCCCACAGA TTTATTGTCA GCAAAAGAGA TGAGAGTTAG TTTGAACAGT 4 920 

CTGCCAACAA TATGATTTGA TGAATTCTAG GAAGGTATTT TCTGCAGTAA AATATTTCTC 4 980 

CAACTATCCT TTTGCCAGTA TCTAAAATTT CAGATTAGAG ATAACTTCCT ATTCACTAGA 5040 

AAAACTGGAT TAAAACCTGA TTAATTAGGC TTTATTGAAT ATTAAGGGTT AAGTATATAA 5100 

CTGTGGAACT TGTAACAGTA TCACATTTCA AATTTCTCTT AAAACTATAT CCAATAGAGG 5160 
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AATGTAAACT ATTGTCTCCA CTCAACGAAG TCAAAGAGTC CAAAGAGTCT CCCTGCAGAG 5220 

TGAAACATAA AATAAGCAAA ATTTCATAGG CTGCCTGCAC TACGGCTATG TGAGGGTTTT 5280 

GGTTACCAGG TGACTGGGAG TTTCCAAGAA GGATGCTGGG AGCCCCATGC TCTTCCCTGG 5340 

GAAACTTTGC CTTTTCACTA CTCTACCATC CAGAAGCAAT TTTTTAAATG GGTTATTTAT 5400 

TAATTTTCGT ATTTACACAA CTCCTACTGA GATTACTTAA CATATTTGGT GGTGACAAGT 54 60 

TAACAATAAA TAAGTAAATT TAAGAATCCT TGTCCTATAC CCAACCCAGA CAATAGAGTT 5520 

CTTCCAGACT CTCCAGCACC CCCTAGTGGC ACATATGGAC CATGGGACGG GTAGGTAATT 5580 

AGCATATATT TTTCGTTCTG TTTCCAGCAA CGGGAAGCAC TTGGCAAGCA TCACCTTCTT 564 0 

TTCTTCGCAA TACTGCTAGG AAGTATGTAT TATGATTATC TTTATTTACA TATTAAGAAG 5700 

AAACAGTTTT CAGATAAAGA ATTTGCTCAG GGGAACATAG GTGGCGGGAG AAAAAAAACG 57 60 

AGGGTTTACA ATTTCGGAGC TCTCACACTT AATAACCTTG CTGAAGTATT GATAGAGGAA 5820 

AACATGATCT TCTTTCAGCC GCTAACCTTC TCTGTTTCCT TTATTGTTCC TAATACCTTG 5880 

TATTCACGTG GGAGTTACCA TGTACATTTT TTTTCCTGTG GGTTTTCTTT TAATATTTGG 594 0 

ATTTGGATCT CCTCCTTTTC CAGATGTATA TGTTTAGTTA TTTTAATTTT CATGTAATAC 6000 

TCTCTAGACA TATCTCAATC TTGGTTTTCT TCCTCTAAGT TCAATCTGAA ATATCACTTT 6060 

CTCTCTTAAA TTTGGCTCCC CCAAGATCCA ACATTCCAAA CATATTGCCA ATGAGTGTAT 6120 

ACCTTTTAGC TTGAAAGCAG CAGAAAAAAA GTGGTAAATA CCTGAGCCAG GGAACTTAAT 6180 

TAGGGGGTTC TATCAGTGAT CAAGGCCAGT GATCAAGGGA GACACCAGCC TAATGAAAGA 624 0 

TGACAGAAGA TAGCAATACT CTAATAGAGA TGTGGTTCAC AAAGTTCATT GTGCAGAAGC 6300 

AGCTAGGGAG AGCTTCTAAA ATACAGAAAT CTGAGCCCGT CTTTTTTCTT TTCTTTTTTT 6360 

TTTTTTTTTT TTTGAGATGG AGTCTCGCTC TGTTGCCCAG GCTGGAGGGC AGTAGCGCAA 6420 

TCTCAGCTCA CTGCAACCTC CATCCCCCGG GTTCAAGCGA TTTAGCTGGG ATTACAGCCT 64 80 

TGTGCCACCA CACATCTGGA CCCATCTTCT AATGCAACTG GTCCACTGAC TGGCATTTGG 6540 

GAATTGCAAT TTTGCCTCTA ATTGTAGGAC AAGGAAGTAA GAAGAGTTTT AATCATATTC 6600 

AATTCAAGTA ATGGAGCAGA TAGATGTAAG GTCCATCCGA AAGAGTGAAA TGATAGAATC 6660 

ACAGAATATT CTTAAAGAAA GGCAATTTTA TTCTTTCTAA CTGCTTATGG TAACTACCCA 6720 

TGAAAGCAAA T^TATTGATT GGTAAGGGTC AATATAATGA TGTTTCACGA AGAAAAAGTT 6780 
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TAATTTGTAA GTTTTTGTAA TTCACATTTA TAATAAATAA ATCTGTTTCT GCTTTATAAA 6840 

TTTCCTCACT TGAGTAGATT AAATATTACC CTTATAATCT TCTTTAAACT TACTGTTTAC 6900 

AACCTTTTTA TTGTCATGAA GTCAAACATA AACTTCAATT CAGCTCGTGA TCAAAAGATC 6960 

ATAAATTCTA AATAAGTGCT ATCTGAATTA ACTTGGTTTG CTAGAGTTTT CTGACATTCT 7020 

GAAAATTCTA TATTAGAAGA ATTCTTTATT ATATGATAAT TTATGTTAAA CAAATTATAG 7080 

CAAATTCTAC ACATAAGGAA ATTCAGACTA TATTTATGCT TAATTATCCA GGCAGTAGTA 714 0 

GTACTTAAGT AAATATGTGA GTTAAATTTA TCTGTTTTGA AAACTGTGCC TCTGTCCTCC 7200 

TCTTGATTGA CAATAAACCC TCTGTCTCCA CTTTCACATC TCCAAAGTTC AAGTGCATTT 7260 

TAATACAATA TAACAATAAG CACCATAAAG ATATAAACTA TGTTTGTACT GTTAGCATCT 7320 

TATCCCTAAA TCCAAGCTCA GGCCCTGGTC AGTTCAAGCA TTTGATACAT ACTTGTCTAT 7 380 

TAAATCAACA TTAATCATCT CTTCATAACT AGGAAAACTA GGCCAATTTT ACCCAGATTT 74 4 0 

GTCTAAATAC ACAGATGCCT ACTTCAGCAA ACTAAATGTA GAAGGAAGCA CATATGAAGA 7500 

CAAGGGGGTC TTTTTTAGCT GCTATTTACC AATTAACCCA ACAATAAAAG TTTATCACTT 7560 

GGCTGGGCGC GGTGGCTCAC GCCTGTAATC CCAGCACTTT GGGAGGCTGA GGCAGGTGGA 7 620 

TCACCTGAGG TCGGGAGTTC GAGACCAGCC TGACCAAAAT GGAGAAACCC CAACTCTACT 7 680 

AAAAATACAA AATTAGCCGG GCATGGTGGC GCATACCTGT AATCCCAGCT ACTCAGGAGG 7740 

CTGAGGCAGG AGAATCACTT GAACCCAAGA CGGGGAGGTT GCAGTGAGCC GAGATCATGA 7800 

CATTGCACTC CAGCCTGGGC AACAAGAGCA AAATTCTGTC TCAAAAAAAA AAAAGGGATT 7860 

ATCACTTGAT CTTCAGAAAA ATAGTGAGGT CATTATTGTT TGCTGACAGA CTACACAAGT 7920 

AAAATCTCCC AAAGGCCAGT TTTGCCCTGG CCCTAAGATT ACTGTAGGGC CTCAGACATC 7 980 

AAATCAGTTC TTCTCATCAC TCAAAATTCC CTTAAAATTG ACCTGACAGA GAAGCCAACC 8040 

ACATTTTTAA GCCAAATTGT TGGGTCTTTT AAAAACTAGC ATTTTGGCTG TAGTATAACA 8100 

GTCTTAGTTT AACTGATTCA AAACTATGGC TGGCTTAGTA AATTTAACGC TAGTGGCCAA 8160 

TAATAACAGA AAAGAGATAA ATATTCTTAA GTATGTATTT TGAGCCAGGG ATTCTGCTAA 8220 

GTACTTTATT CACTCTCATT AAAGCCTTGA AACAATTGTT GCATGTTTAA GTTATTAATG 8280 

AGCCCCATTT TACAGAGGAA AATGAGGAAA CTGACCTATG TAACTTGCTC ATGGTCACAA 8340 

GCCATTA/^G GTGGCAGAAT TAGGATATCA ATCCAGTCGG TGTGACTCCA GAACCCTCCT 8400 
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ATTTACTCTA TACTACTCAT AAAATTATTT GGTCTTGGGG CTGGGCGCAG TGGCTCATAC 84 60 

CTGTAATCCC AGCACTTTAG GGGGTTGAGG TGGGTGGATT GCTTGAGCTC AGGAGTTTTA 8520 

GACCTGCCTG GGCAACATGG TAAGACCTCA TCTCTACAAA AAAAAAAAAA AAAAAAATAC 8580 

AAAAAATTAG CCGGTGTAGT GGCACGCGCC TGTAGTCCCA GCTACTTGGG AGGTTGAGGT 8640 

GGGAAGATCA CCTGAGCCCA GGAGGTTGAT GCTGCCGTGA GCCATAATCA TGTCACTGCA 8700 

TTCCAGCTTG GGCCACAGAG TGAGACCCTG TCTCAAAAAT AATAATAATA ATCTGGTCTT 8760 

GAGAAAAAAT AGTATTTTTT TCTTCATAAA ATATTTTCCA TTTTGAGAAC TTGATTAAGA 8 820 

AACTCATTGT CTTGCCAATG ACATTACATT CAATCATGCT GAAACATCCA GAAATAGTTT 8880 

ACACATCAGT TTGACATCAG TATTATGCAA TTTGAAGCCA CTGTTTGAAA ATAAAAACAC 8940 

TGTACCGTGA TTTGTTTATC CAGAGTTCAG ATTATTATAT CCTTGTATAT GAGACAGAAA 9000 

CCCCCTTGTA TTCTAGTGCA AACTCTCTTT GGATCTTAAT ATGTATAGTT AACAATAATA 9060 

CCATACTACA TTCTAACTAC CTAGAAAGCT AGCATACCTT AACCTGATTA ACTTTTACCA 9120 

AGTTACTTGA AATTATAGCA AAGTTACCAT TTA7VATCTTG ATTCTGGCCA GGTGCAGTGG 9180 

ATGAACCAAG CATGGTGGTG CCTGTAATCC CAGCACTTTG GGAGGCTGAG GCGGGTGGAT 924 0 

CACGAGGTCA GGAGATTGAG ACCATTCTGG TTAACACAGT GAAACCATCT CTACTAAAAA 9300 

ATACACACAA AAAAAATTAG CCGGGCGTGG TGGCAGGCAC CTGTAGTCCC AGCTACTCAG 93 60 

GAGGCTGAGG CAGGAGAATG CCGTGGACCT GGGAGGCGGA CTTGCAGTGA GGGAAGATCA 9420 

CGCCACTGCA CTTCAGCCTG GGTGACAGAG CGAGACTCTG TCTCAAAAAA AAAAAAAAGA 94 80 

TTTGATTCTA TCAGTCTACT CACCTTTATA GCTTGACAAT GATTGATTTG TGTAAAAGGA 9540 

TTCAAATCAA AATTTGCAAA CTCCCTTCCT CCAAAGGTAC TCATTTTATA ATACTGAAAT 9600 

TCTCTATTAT GTTCTCTGCC CAGTGTCCCA GGGTTTATTG GTTTCTAAAG AGGTAGTGGG 9660 

TATATACAGC CTCCCCAAGG GGAATTTAGG AAGTAAGCTG GTTGTCACAA AGACTGGCAT 9720 

TAAATAGGTA GAGACCTAGG ATGCTAATAT CTTGCAATGT GCCAAAATAA TTGTCCCTGT 9780 

CCCCAACCTC ACCATTGCCA ATATTACCCC TACCCCTCAC AGTGAGCGTC ACAGGCAGGC 98 4 0 

AACAAACTGG TGTCGTCACA GAATGATTGA TGGAACACAT AGACTGCATT CATTACCTAA 9900 

ACATTGTCGT GACACTGCAG CAACCAAAGA CAATCGCATT ACCCAGGGGT TAGATGTAGG 9960 

AAGAGTAAAA AACAAAAAAT TTTTGAATGC GTAATTATCA CTAATTATTT TATTTGATCC 10020 
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TTCAGGAGAA TGTGGAAGAT GGCCGAGCAA GTATCTATCA ATCTGTCGTT ACCAACACCA 10080 

GCAAAGAAAT GTCCTGTTTC AGTGACTTTC CAATGCCTGA AGATTTTCCA AACTTCCTGC 10140 

ATAATTCTAA ACTTCTGGAA TATTTCAGGA TTTTTGCTAA AAAATTTGAT CTGCTAAAAT 10200 

ATATTCAGTT CCAGGTATTG TATTTTTGGG GAAATGGGTT TCTCTGCATT AGTTCAGCTC 10260 

ATATTTAGAT AGAAAAGTTA CTCTGATAAT GAAAGCAATT ATGAATGAAG TATCCCATTC 10320 

TAAGTATTTG TTGAAATATA ACAGCCTCAT ATAAAACCCA AAAAGTAGTG TCATTACCCT 10380 

TGGTATTATA GATTATATAC ATTAATTGAA GAGGAAAATC ATCTGTTAAA ATTAAAGGTT 104 4 0 

TGAATAATAA TATATTGATG TCAAAACTTT tTTTTTTTTT TTTCTCCCTG AGACAGAGTC 10500 

TCACTCTGTT GCTCAGGCTG GAGTGCAGTG GCATGATCTC AGCTCACTGC AACCTCTGCC 10560 

TTCCAGGCTC AAGTGATTCT CCTGCCTCGG CCTCCAGAGT AGCTGGGATT ACAGGCACAC 10620 

ATCACCATGC CTGGTTCATT TTTGTATTTT TGGTAGGGAC GAGGTTTCAC CATTTGGGCC 10680 

AGGCTGGTCT CGAACTCCTG ACCTCAAGTG ATCCACCCGC CTCGGCCCCC CAAAGTGCTG 10740 

GGATTACAGG TGTGAACCAC CACACCCAGC CTCAAAAATT CATTTAAACT AATATCTGTT 10800 

ATCATTGAAT ACACCTAGCT TCATTTGCCT TGAAAGGGCG TATACCAAAA TTAAATTGCT 10860 

GTTTTGTTTT CTTAGCTTCT TCATAGAAAT GGGATTTCTT AGATGTGTAT TAAATAAATT 10920 

CATTGGTCTC TGTTCATACT AGAAGGCTGT GGGAAGTATT TGCTTATCAT TTTTTTCTGA 10980 

ATGCAATCTC TTACAACCTA AAGATGGCCA GATCATTTTG AAAAACACTT GGAATTACCT 1104 0 

TTTCCTGTGC TTCCTCAAAA TCAACAAAAA GCAATATTTT AATTAAGCAT GCTGAATTTT 11100 

TATCAATGGT CTATACTTTG AGAAATAGCT ACTATGCTTA GAAAATAAAA TATAAATCAC 11160 

ATTTCTTGGC CAGGTATGGT GATTCATGTT TGTAATCCCA GCACTTTGGG AGGCTGAGGC 11220 

AGGAAGATCA CTTGAACCCA AGAGTCTGAG ACCAACCTGG GCAATACAGT GAAAATCTGT 11280 

CTCTACAAAA AATTTTTAAA AGATTATCCA GGCATGTTGA TACCCACCTG TGGTCCCAGC 1134 0 

TATTCTAGAC TGAGAAGGGA GGATCGCTTG AGCCTGGGAG GTCAAAGCTG CAATAAGTGG 114 00 

TGATTGTGCC ACTGCACTCC AGCCTGGGCA ACAGTGTGAG ACCCTGTCTC AAAGTAAATA 114 60 

ACTAACATTT CTGGATAAAT AACTGTTAGT GAGGCTTATT TTTAATACAT GTCATTTTCT 11520 

TAGTAATTCT AATACTAGGC TTATATAATA TCAACTTACA ATAGTAAATT TTGGTGAAAA 11580 

TTTGTATTTA TAAATTCCAT TAAAATGTCC AGTTCTACCT AATGTAGTTT TTCACCAATT 11640 
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CCTGGTAGAT CTAACTTGTG AATAACAGAT TATGTATACC AGAAGGTTTT GTAACTTTGT 11700 

GCACTTAACT ATCAATCTAC TTAACAAATA TATTGCCTTT TTATGATATA TAACTTCTAT 11760 

TCCATTCTTT TAAAGATCAT GTTAGAGTCG CAAGGAAGTC ATTTCTCTTG GTTATTGTGT 11820 

TACTGCTACT TTTGTTTCTT GGAGAGTGAA GAGGGGTTGG GAAGAAAGGT TTCTGTTTAT 11880 

TGGTCTCTGA GTTGGTGTAA GTCATAGGTG TTAGAGCTCA ACTCGAGAAG CAGGCAAACT 11940 

GTAACAAGCC CTGTTGCTTA TGATTGTCAA TGTAATCTAC ATCAGTGCTT CTCAAACTTT 12000 

AATGTGGACA TGAATCACCT GGATATCTTG TTAAAAATGT AGGTTCTAAT TTAATAGGTA 12060 

TGGGGTAAGT TCTGAAATTC TGCATTTCTG ACAAGCTTCC AAGTGATACT GAAGATCCTG 12120 

ATCCTCAAAT CACATTTTGA ATAGCAAGGA TCTACAGCAC TTAGTTAATA TACTACTTTG 12180 

AACTACCATC TGAAATCTTT TCTTTCATCT GAAAACTGCC CAGATATTTA AAGCCCTTTT 12240 

ACAAGATTTC TACTAATATT CCATATACAT TTTTAAATTG AGACAGCTTA AAAATTACCA 12300 

ACCCAGCAGT TGGAAAAATA TCTGAAAATT TGAGATATAT AAAAGACTAA AATACTTGCA 12360 

AATGAGAAGC ATGCCATTCC TCTAGCATTA TAAACTTTGC TTCCACTTGA CATCGTTTCT 124 20 

TAATCCAGCA GATATGAAAC ATTTATGTAC AATTTTAAAA ATTAACAGAC CTCCAGTGAG 124 80 

CTACATTTAA AAAAATCAAT GAACCAATAA ATCATTTTAT TCAAATAAGA TCATGAACTG 12540 

TCTTGCTCAC ATGATGTACT CTGTTTTAAA AATAGCAAAT GTTAAAAACT ATCATTCAGT 12600 

GGAATGCTGA CCATGTGTCA GGCACTCTGC AAAGTGTTTT GCGTGAAATA TCTTCTCTAA 12660 

TACAAAGTCC ACAAAGAGGC GGCTACATAA AACGTTCCTG ACATATGCCA ATTGCATGAT 12720 

CACTTGAATT ATTGGTTTGT TTCCTTGTTC AGATTATCAA ATAACAAACA GAGAGAAGTT 12780 

CTTTAAAAGA AAAGATATAT ATTTGGTGAT AGAGCATTGT AATGAGAATG TACATGCCAT 12840 

GGTAAACTAT TTGTGTATTC AGGGAGTTAA AGGAAGACAA AGGTTTTTAA ATGGGGAAAA 12900 

AATACAATTA CATAATTGTT TTGAAATAAT lATATAAAGA GCAATAACAA GGGTGATGCC 12960 

AGTCTGAGAT TGGACAGTTA CTGAGCAGAT GTTCTTGTAG AAGTCATTTT TGTGTAAGAT 13020 

TATGATGGTC TTTGTGTAAG GTGGTGGTTT TTGTAGTTTT TGTTATCAGG CACACATCAT 13080 

GAGAACCCGC TCTTTCTGGC CTTTCCCAAT TCTATTTGTC GGGTTTCTTA ACATTAGTGA 13140 

CTCCATCTAG ATTCTGACAG TTTTCATGAG AACTTGCTTT TCTTTTCTCT CTCAAGTCCT 13200 

TATTCAGTAT TCAGCACCCT TAACAGATTA GTCCCACTGC TGAGTCAGGC CTCTTGCATG 13260 



wo 98/24914 



PCT/FR97/02226 



58 

AAGCAGCAAT GAGAAAGACA CACTTGGCCA ATGTTATCCT GGAGTAATTC TCAATGATGC 13320 

CTTCTCTGTG TTTCTTCAAG ACAACTGTCC TTAGTGTGAG AAAATGTCCA GATTTCTCAT 13380 

CCTCTGGCCA ATGGAAGGTT GTCACTCAGA GCAACGGCAA GGAGCAGAGT GCTGTCTTTG 13440 

ACGCAGTTAT GGTTTGCAGT GGCCACCACA TTCTACCTCA TATCCCACTG AAGTCATTTC 13500 

CAGGTGAGAC CCGCTGGGAT TCCCAGCTTT TTGGAGTAGG TTTCCAGGTA CTTTATATGT 13560 

AGTTTGGATT GACAAGCAGG ATTCATTGCT GCAACTGGGC AGAACTTGGC TCAATAAGAT 13620 

TGAGACAGAG CTAGAAAGAT GAAAGACACC AAACATCATC TTTGTTTCTA TTGGCCTCTG 13680 

AGTCTTCATC ACACATAGAT CTCAGAGCCA ACTTCCTTGG AAGTCACTAA GTCCTTGGCA 13740 

TAATTTTAGA GAATTCACAT CAAACTGGTT CTCTGTTGGA GAGGCCCTTT TAGCCATGTG 13800 

CCTGCGTTGG CCTTTTTCTA CCCTGCCAAA CACCGAGCCT TTTTCACAGG GCCATACTCA 138 60 

CACACAAGGG GAGAGCTCCT AGAAAGAAAT GCTTTGCAAG TTAGTGATGG GGAGAGAAGT 13920 

GCAGGAATAG AACCCTGCAT CCAGCTGTTC TGGTCCACCC AAGTCTTTCC TCAGAGAACA 13980 

CACTTCTTTC CCAAGGCCCT TAGGAAAATA TGTAATATAG TGGTTCATAG TCCAGGCCTC 14 040 

ATATTAGAAT CACCTGGGGA GCTTCTAAAG CCCTGATGGC CTGGAGACCT ACCCCCAAAG 14100 

ATTCAAACAC TATGGAGTAG GGTTAGAGCA ATGAAAGTTT GCTCAGGTGA TTTTAATATA 14160 

CAGTCAGGAT TAAGGCCTGC TCATCTAAAG CAATTGTTCT CAAATAGAGT CACCTGGAGG 14 220 

GCTTTTGAAA GCACAAATTG CTAGGCCCCA CCCTCCATAT TTCTGATTCA ATAGGTGCTA 14 280 

TGGCTTGAAT GTCCTGTCCA AAACTCATAT TGAGATTAAT CCCCAATGGG GCAGTATGAA 14 340 

GAGGTGGGGC CTTTAAGAGG TGATTGAGTA GTAAGAGCTC TGCCCTCAAG AATGGATTAA 14 4 00 

GCCATTTGTG GATAAATAGG TTAATGGATT ATTGGGTTAC ACAGGAGTGG AACTGGTGGC 144 60 

TTTATAAGAA GAGGAAGAGA GACCTGAGCT AGCATGTTAG CATGCTTGGC TCCCTCACCA 14520 

TACT^TGCCC TATGCTGCCT TGGGACTCTT CAGAGTCCAA ACCAGCAAGA AGGCTTTCAG 14 580 

CAGACGCAGC CCTTCAACCT TGACTTCTCA GCCTCCACAA TTGTGTGCCA GAAGAAATAA 14 640 

CTTCCTTCCC CTATAAAATA TTCGGTTTCA GATATTTTGT TAAAAACAAT AGAAGACAAA 14 700 

TTAAGACAGT AGCTCTGGCA TGAGGCTGAG AATTTGCATT TCTAACACCA GGCAATGCTG 147 60 

ATATTGCTGG CCATGTGACC ACACTTTGAG AACCAATAAT CTAAAGATTC TTTCAAGCAA 14 820 

CCCCACCATC AATGGCAAAT ACTTTATAAA GTCATGTGTT TCCGTGAAGT GTAAAAGTAG 14880 



wo 98/24914 



PCT/FR97/02226 



59 

TAACTAGGAA AGGACACAGA AGAAGCTTGT CTGTGATTAA CCACCAGCAA GTCACTGATT 14 940 

TACACAATAT GGAAACCAAC TCCTATGTGC CTGGTTTTTA GTTTTAGTTT TTGTTTACTT 15000 

TTTGAAAATA AGATTGCTAA ATTGTATTCT AACTATTACA CAATTATAAT AATAGCACTT 15060 

CATAATGTGC TTAAGAAATA TTTAAGAGTA TCTGATAAGT GATTTTTTTT TTTTTTGAGA 15120 

TGGAGTCTCA CTGTCACCCA GACTGGAGTG CAGTGGCACG ATCTCAGCTC ACTGCAACCT 15180 

CCACAACCTC CATCTTCCAG GTTCAAGCAA TTCTCCTGCC TCAGCCTCCC AAGTAGCTGG 15240 

GATTACAAGT GCACGACCAC CCCTGGCTAA TTTTTGTATT TTTAGTAGAG AGAGCTTCAT 15300 

CATGTTGGCC AGGCTGGTTT CAAATTCCTG ACCTCAGTTG ATCCGCCTGC CTTGGCCTCC 15360 

CAAAGTGCTG GGATTACAGG TGTGAGCCAC CACACCTTGC CTAATATGTG ATATTAAAGG 15420 

GTCAAATGTC ATTATATAGT CCAAAATAGT ATATAATAGG CAGGCAGAAG ACAGTATCTG 154 80 

GTCCTGCTGT GTTCATCACC ATTTATTTGT CTCTGATAGA GACAAACTGC AGCCGTAAGC 1554 0 

TGCAGCCTCT GAAATAAAAA ATCAACCCCT TTGGTCCTGT TTTTTTGTTT GTTTTTTGTT 15600 

TTGTTTTGGT GTTGTGACAG TCTCACTCTG TCACCCAGAC TGGAGTGCAG TGACTCAATC 15660 

AGGGGTCACT GCATTCTTTA CTTCCCAAGC TCAAGCAATC TTCCCACCTC AGTCACCCGA 15720 

GTAGCTGGGA CCACAGGCAT GCACAACCAT GCCCAGCTAA TTTTTGTATT TTTTGTAGAT 15780 

ACAGGGTTTC ACTATGCTGC TCAGGCTGGT CTCAAACTCC TGGGCTCAAT CAACCTGCCT 15840 

AGGCCTCCCA AAGCGCTGGG ATTACAGGCC CCACCTGGTC TGGTACCTAA ACTTTCTTAT 15900 

GTGCTTTACT CCTATAGAGA AGAGGCAAAA CAATTATTAA CTCCAGAAAG GAAAAGCTGG 15960 

CAATGCAGTT TTATTGAAAT TAGCTTGACA TAGTTGCTCT GGAGCTCACA GACTTCTCTC 16020 

TTCTTCCCCC TGAAGGTATG GAGAGGTTCA AAGGCCAATA TTTCCATAGC CGCCAATACA 16080 

AGCATCCAGA TGGATCTGAG GGAAAACGCA TCCTGGTGAT TGGAATGGGA AACTCGGGCT 1614 0 

CAGATATTGC TGTTGAGCTG AGTAAGAATG CTGCTCAGGT GTGATGCTCT CTGCTTACCA 16200 

TGTACCTGGA GGGGAGGAAG TGGGGATGCC ATACTGGAGA ACCCCAGCCA TATAATCGCG 16260 

GCTCCAATCC TCATT7\ACTA GTTGGTTGGT AGCGCATTGT GGCATCATAG AAAATCTGGA 16320 

AGTCAAGAAA CCACTTTACC TCCTAGCTCT GTCACTAACC AGCCATGAAT CCTAGAGTGA 16380 

TTCATTTCAC TTCTCTGGGA GATGGCTCCC TCATTTTTAA AATGGGAACT TTTGACCAGA 16440 

TGATTTTCCA TATAAGAGGC CTTTCATCAA CATGGCTCAC TGCAGCCTTG ACCTCCTGGG 16500 
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CTCCAATCTT CCTGTCATCT CAGCCTCCTG AGTAGCTGGG ACTACAGGCA CATGCCACAC 16560 

CACACTCAGC TAATTTTCAT ATATTTGTAG AGATGAGGGT CTTGCCATGT TGCCCAGGGT 16620 

AGTCTAAAAC TCCTGAACTC AAGCAATCTG CCCGCCTCAG CCTCCCAAAG TGCTGGGATT 16680 

ACAGGCATGC ACAACCACAC CCAGCCAAGA GGCCTTGTTT CTACCTGGAT GTTTAATGAG 16740 

AGGTTAATCT GTTCATATTC TGGAGGGTGG CTTTTAGAAA TTTAGTGTGT ATTTGAATTA 16800 

TATTTGAAAT ATAGATAACC TTCAGTTACC CAAATATTAT GAAAAGAAAG ATTAAATAGA 16860 

TAGTAGGTCT CTCAACTAAA ATCATAGATA TTTAGGTGCT TCCTGAGGCC TTCTAACCAC 16920 

TGTCTTCTTT GCACCTGCTC AGGAATGACA CCAGCTGAGC TGCCAAAGAG TCAAACATTC 16980 

ATTACATGAT GATGCTGCTG ACAGTGGTGG TCAGGAATAG CAAAAACTAA ACTCCTTCTG 17040 

CAAGGACAGA CCTAGGCAAA GAAGGGAAAA TCACTAAACA TCCTTTCCCA AAGTATTCCC 17100 

TCTCAAGAAG GCCTGAACCA GATGCCCAAT CACTCTTACC CTAGCTCTTT CAGCCTGATG 17160 

TCTCTGGCCA CCCAGGGCTT ACCATGGCCC TGTGCACAAC CAACAAATCA TTTCCATCCT 17220 

AAGTCTTACA CTTTCAGGAC TCTAGATACC CAGTGGCAAA AGTTACAAGC AAACATGACA 17280 

CCCGCCCAGC AGGTTAATGA AGGGGTTATA CTGGGACCTG TCAGAGTCAT CTATCAGTCA 1734 0 

GTTAGTTAGT GCCAGCCCGG GAACAGAGCA GGTCACTAAC ACCGGAAAGA GACTTACTAG 17400 

ACCCAATAAG TCTTCACTTT GTGAAAATAA ACCTCTTGTC ACTTATCACC TCAGTGTGAA 174 60 

GAACAAGTGA GGAGGCAGGA ACTGTGACAG CCTGGAGAAG AGCAGAGCTG GAAAATGAGA 17520 

GTACCAGCTC TAGGCTCTTT CATGCTACGA ATACCCGCAA AGCCTTAGGA ACAGAGTGTA 17580 

ATGGGGCAGT ATGTGAGGAG CTAATATAGC AGTCAGCCAA GTGAAGATCC ATCCTAGACT 1764 0 

ACTTCACGTT GTCAGACCAG TGATTTGGAT TTAGATCTCT TCATTCCAAA GATATCAAAT 17700 

CTTAGATGGC AAGAACCAGT TCCTTGTATG GGTCTTGCCC TACAGGAAGA CTTATGGTGT 17760 

GAGATTCAAT ATTAAGAAAC TACCTTGGCT CTATTTGCAT GCCTTACAGC TTCTTAAACA 17820 

ATCTTTTGCA CAGAGTGCAA AAGACTTTGT TTCCATCTCC CTCTATCAGT GTAAATGCCA 17880 

CTAGATGCCC CCTTTTTAGG AGGTACTTCA CTTTGAGGTC AATCATCTTT AAAACAGAGC 17 94 0 

CTCAGTAAAT TCTGGGGCTA TGCATGTGAT ACATCACCTA CATAATAGAT TCCTCCTAAA 18000 

TATAATGTTA TAATCATACA TTTCCAGGAT TATACTCATT CATCTGCACT AATCTCTTCA 18060 

ATATTTATTA GAGTAACAAC ATAAATCTAT AACTATGATA AAACCTCTTA CACAGAGTAA 18120 
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TATACTCTCA AGCCTTCTGT GAAAAGACTA ACCAGAGACT TTACAGGAGC TATACATGCT 18180 

AGGAACGGAA CTAGGCGCAT CTGCAAAACT TGAAATTACA ACCTGAACTC ACCAAAATTC 18240 

TGAGTGTGCA CTGCTCTGTT AAAAGAAATT CACCTTCATA AGGTTACAGC ACCCTCTACC 18300 

ACAATCCAAA AGCACCACTC AAGATCATAT GGGATGGTGC TGCATCATTG TATTAGTCCA 18360 

TTCTCAACGC TGCTATGTAG ACATACCCGA GACTGGGTAA TTCATAAAGA AAAGAGGTTT 18420 

AATTGACTTA CAGTTTGGCA TGGCTGGGGA AGCCTCAGGA AACTAACAAT CATGACGGAA 184 80 

TGCACCTCTT TACGAGGCTG CAGGAGAAAG AATGAGAGCG ACTGGGGAAC CCCTTATAAA 18540 

ACCATCAGAT CTCGTGAGAA CTTACTCCCT ATTAGGAGAA CAGCATGGCA GAAACCTCCC 18600 

CCATGATTGA ATTATCTCCA CCTGGTCCTG CCCTTGACAC GTGGGGATTA TTATAATTTA 18660 

AGGTGAGATG TGGGTAGGGA CACACAGCCA AACCATATTA GTCATTTACA TACTTCTGAC 18720 

CAAAAACCAA ATCTCTGGCC TTTGACCTAA AACATGCGTC TCAGAGAAAG CAGCCTGAGC 18780 

CTAAATCCTC ATGTTTCTCT CACTGTTGCA GCTAGTGTCA TTAAGGCAGG TTAGACCACC 188 4 0 

CTGCTGTAGG GAGGGTCACA ACAGAAAAAG AGTGAATCAA ACGGGCAGAG CATACCATTT 18900 

GAAACATGGT TTGCTCCTGA GAAAGAAGAG GGGACAGTAA GTAATGGAAA GAGACACTAA 18960 

TGAAAATATT TTTGTATCTA ATATCTAATC AAAGTATTGC CAAGTCAGCC TATAAGGGCA 19020 

ACGGCAGGAG AAATTCAGAA CATAGGTATA TACCACACAC AGACCAGCAA TATAGGAATG 19080 

CTTGGTATAG GTGCTACTTC ACAAGCTAGG AATGTAAGGC CCATCCCCAC AAAATTTGTC 1914 0 

TCCAAATTCT GGTTTACTCC AGACATAAGG CACTGTATGA AACTCCTCTC TTCCAGCCTA 19200 

ACTTTATAAC TTAACAGCTA GCAGTACTTA TCACTTGCCA GGCAATATTT CAAGTACTTT 19260 

ATATATACCA CCTCATTTAA TCTACACAAG AATGCCATGA GGTAGGTACT GTTAATACCC 19320 

CCATTTTACA GAGAGAGAAA CTGAGGCACA GAGAGATTGA AATAATTCAA CCATGGCAAC 19380 

ACAGATTGAA ATAGTTCACC CACAGTAGTG XGATTGGGAT TCAAACCCAA GCAGTCTGTA 19440 

TCCAAACCTC TCAAGTAAAT TGGTTACCTT GCAAGTGAAT CTTATGTGTT TATCAAGTAT 19500 

AGCCTTAAAC AAAAACTTAT TGCATGGTAT GTAAAAATTT AAGAAGCAGT TCAAGTATGC 19560 

ATTTGGCCAA TGGGGGAGTA ACAGCAAACA CAGCAAAATA TACATTTGAA AAGAGATTTVA 19620 

ATGTACATTT TGGAAACAAG GGAAATCTTA ATAAACAAGG TAAAGAATAC ACCTGAAAGA 19680 

GGATTCAGAT GTGCACTTGA AGAGAAAGAG AATCACAGTA TAAGTTCAGA GTTTTTAACT 19740 
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TTTAAAATAC ATTACAAGCA CTGTGTCTCA TGCCTGTAAT CCCAGCACTT TGGGAGGCTG 19800 

CGGCAGGAGG ATTGCTTAAG CCCAGAAATT TGAGACCGAC CTGGGCAACA TAATGAGACC 19860 

GTCTCTACAA AAAAATTGTT TGAATTAGCT GGATGTGGTG GTACATGTCT GATACTGAGG 19920 

TGGGAGGATC ACTTGAGCCT GGGAGGTCGA GACTGCAATG AGCTATGACT GCACAACTGC 19980 

AGTCCAGCCT GAGTGACAGA GCAAGACCCT GTCTCACACA CACACACACA CACACACACA 20040 

CACACACACA CAAAATAAAG TCTTTTAAGT ATGGAAGGAA GATTATTTCC CCTGTTATTC 20100 

TCCATCCAGG GATATTCAGA TGCATATACA CTTATACTTG TGTAGTCACT AGGCTATAAT 20160 

CGCACATTTC CAAGGATTAT AATCATTCTA CCTGCACTAT AGAAGAAACT TAGGTGAGTG 20220 

GAAAACATGA GAGGAGGGAG GGAGGAACTT TCTCTTAAGG AGCAGCAAAC CACAACTGTA 20280 

AACATGGGAA AGACTTGTGG ATTTTATCAT CAGAGTTAGC CCAAAGACTT TCTCGTGTCT 20340 

CCATGAAGTT CTCAAGATTT TGTTGCAGTC TTCCTGCATC AGTGTAAATG CCACTGGGTA 20400 

CCCCTATTTA GGAGGTACTT TACATTGAGG TCAATCATCT TTAAAACAGA ACCTCTGTAA 204 60 

ATTCTGGGGC TACACATGTG ATACATGACC TTCATAGTAG ATTCCTCCTA AACGGGACAA 20520 

TGCCCTAATT TAAACTGCAT TTCTTTTTGC TTGCCAGGTT TTTATCAGCA CCAGGCATGG 20580 

CACCTGGGTC ATGAGCCGTA TCTCTGAAGA TGGCTATCCT TGGGACTCAG TGTTCCACAC 20640 

CCGGTTTCGT TCTATGCTCC GCAATGTACT GCCACGAACA GCTGTAAAAT GGATGATAGA 20700 

ACAACAGATG AATCGGTGGT TCAACCATGA AAATTATGGC CTTGAGCCTC AAAACAAGTA 20760 

GAGTTATTTT GCTTTTTTAA TGGTATACTC GTTGGTGAGC AAAGTTGTCT GAAGGTGTCT 20820 

CCCTTAACAA AGATTCAAAT TGCTAACACG GTAGTTAAAA CTACAATCTA ACAATATGAG 20880 

TATCTTATAG GTCCTGGAGT TTAGCTTCTA AATTTGGTCT GTATGCCTTT AAAAAATACT 20940 

TAAGAAGATG AAGCAGAAGT GTTATAAGCT GCTCCAGAAA GCAAAACTAG GGGAGAACTT 21000 

TCTAATACCC AGAGTTATCT AACATTGGAG ^AAACTGTTT CAAGAGATTA CGACCTGCCT 21060 

TTCAGAGGGG TGTGGTGGGA AACATGTAAT TCTCCATCTA ATAATTTATG CTTTGCTAAC 21120 

CCTATAGCAT GAAGGTTCTT CCCATG6GAA ACCTTTGAAA ACACATTCCT TTTTCTTTGC 21180 

TAAAAGACAA ATCTCTGTTG ACGTCAAAGT TATATGTCAG TGATTTAAGC ACAAGCAAAT 21240 

GTTATGAATG GTTCTTTTGC TTTAGTTGTT ACAGGCTTCT TCCCTTAAAA AAACAGAAGA 21300 

GCTTTAGAAT CTTTTAACAA ATGCCTGCCG TGCAACTACC ATATTCTAAG ATCTGACATA 21360 
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AGTGCCACGT ATCGTCTATT AAAAAAAGAA AAAGAAAATG TTCTCAAATC TACAAAAAAA 214 20 

ATAAGCGGAC TTTGCATCAA CATCCATGCT ATTACTAACA 6AGACTCCAT GGATATTTGG 21480 

GATTAACAAA TATCACCAAA CCTAATTTTA TACATTAATT TTCACATTGA TCCCTTCATA 21540 

GATTTCAAAA CTAGTGGAAA TTTAGCAAAT TTTTTCTTAT GATCAAATAG GGGTTAAATA 21600 

AAACAGCAAA ATAATAAAAG CTAGATAGCA TGAAAAAGGT TAAAAACAGA AATGGTATAA 21660 

TAACCACCAT AATACTTGGG GATTGACCAT AGGCACAGGC ATTTTGTCTA AGCCCTTGGG 21720 

GATGCTTCCT TCCTTAAAAT CTCTTTCACT CACGTTGCCT ACATGTTTTC CCTTATTTAT 21780 

TGACAAGAGA TATTTGTGAC ATGAGAATTA AGTCAGA7WV TAAGGATTTG CACAGACAAC 21840 

CAGTTAAGTT AGAGTTTTAC AGATATTTGA AAAGCCCTTT TATTTTCAGA GCCGTACCCC 21900 

AAAAATATCA AGAGGGTTCA AGATTCCTCA GCAAATGATC CTTCAGAATG TTTTTCTTCT 21960 

GTATGTCTCA GATACATTAT GAAGGAACCT GTACTAAATG ATGATGTCCC AAGTCGTCTA 22020 

CTCTGTGGAG CCATCAAGGT GAAATCTACA GTGAAAGAGC TCACAGAAAC TTCTGCCATC 22080 

TTTGAGGATG GAACAGTGGA GGAGAACATT GATGTCATCA TTTTTGCAAC AGGATATAGT 2214 0 

TTCTCTTTTC CCTTCCTTGA AGATTCACTC GTTAAAGTAG AGAATAATAT GGTCTCACTG 22200 

TATAAATACA TATTCCCCGC TCACCTGGAC AAGTCAACCC TCGCGTGCAT TGGTCTCATC 22260 

CAGCCCCTAG GTTCCATTTT CCCAACTGCT GAACTTCAAG CTCGTTGGGT GACAAGAGTT 22320 

TTCAAAGGTA AGTGTGTAGG CAGGTGAGTG GCTAAGCGTT TCAGATCTGG TGAAGTTTAT 22380 

CAATAATGAT AAGAAGGTTG CCTGAGATAA AAAGGTTGCC AAGAAAAAGT TTGACAACCT 224 4 0 

TGGCTGCTCT CACAAGACTA ACATTCTAAA AAGTTACTGG AGAATTCAAA GAATAACAAA 22500 

TACAGGAATT TAGTAATAAT AAATACCTGC AATCATCCTT TTAAAATATT AGACAGTCAA 22560 

GAGAATTTCA ACTGGCATAA AGCTAAGTGC ATGTTAACTT TTCTTTGAAT CGTGAGAGAT 22620 

AAGTTTAAGA AAAAGATCTG TCTCCTGGTT TTACCTCTGT GTTGTTTAAA AATTCCTCAG 22680 

CATATCTGCA AATCAATTTA ACTCTTAATA CTTGAGCAGC TCAACCTCAC AAATCCCTAC 22740 

AAGTTAT7VAA ATTATTAAAA GGTTTCTTTC TGGGTGTCTG TGTAGCACTT CATACTCCTC 22800 

AGAACGGTGT TACCTCCCTG CCTCCAGGGT TCAATTCTGT TCAGCAAAAG CTTACTGAAT 228 60 

ACCTTGCCCT GTGCTGGGAA CTGGTGGGAC AGAGAGAAAT TTAAACAGAT CATTTCAACA 22920 

TAACATGACA AATGCTTTGA TTGAATAATA TATGGAGTGT TCAGGGAAGG AGAGAAAGGG 22980 
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CACTTATCAT GGTAGAATAA GGGAAGGGCA CATGATAAAG GAAAACGTCC TGGATAACTG 23040 

CATTTCTCAG GGGCAGAAAA GGGGATTGCC TGAACAAAAG CATAGAGTCA ATGATGCATA 23100 

TGGAAGGGCA CATGCTATTT GACATTGCTA GAGCATGACG TATGAGGCAG AGAGAGATGA 23160 

GCCATTACTC TTGGAGAAGA AGGAGACAGG ACACAGGAAT TTTTTAAGAC ATGCTATGGA 23220 

GCTTAGATTA TAAATTATAG ATCAGTTCTT CCCAAATATG GCTACATATG AAAATCATCT 23280 

GATGGATCCT TAGGGACCCT GATTAAGTAA GACTGGCCAA GGGACCTGGA ATCTGCATTT 23340 

TAGAAAGCTC TTCAGCCCGG GGCACCAATG AAGGGTTATA AGCAAGGAAC AGGCATTAGC 234 00 

AGATTTACAC TTCAGATAGA TTGTTTCAGC AGTAGTGTGG AATATAGATT TGAAAGTGGG 234 60 

GAAAGACTAC AGCCTCAGGG ATGAAAGAGA AAGCTACTGA AATAGCCTAT GCTAAAATAT 23520 

GATGCATCCT GGGCCAGGGC AGAGATACAA AGTGGAAAGG AAGCCATAAA TGTGAGAAAT 23580 

CATTAAGGGA AAAATCAGCA TGACATTATG ATTGGTTCAA TGTGGGAAAG TCAGAGAAAT 23640 

AGAGAGGAAT CTAGGAGGAC TTACAGATCT CTGGCATTGG AAACCAGGTG GACAGTAGTG 23700 

CTGTGAATAC AGAGGGGGTG TGCAGAAAAT GATGCAAGTC TGGACAGGAG GGCTTCAGTG 23760 

AGGAGCTCAG GTCTGGACTA CTTGAACATG AGATGTCTGA TGACTCTAGG CAAGGGGACT 23820 

TGACCATATT TCAACACATC CAAAGCTCAG GGGACACTTG TGGGCAGGCG ATGGAGTCAT 23880 

GAGCACACAG TAATAACTTC TGCATCAATC TTTCCCTATC TCTACTGCCC TACTCTCATC 23940 

TCTCACCAGG TTTATTTCAA CAGCCTCTTT ACTGGTCTCC CCAGCTTTGG GCTTGCCTCC 24 000 

CTGGAGTCCA TTTTCCTAAA TTCAGCAGCC AGACAGATCT TTCCAAAAAA TAAATCTGAT 24 060 

CTTCTCACTT CATTCAGAAT ACTCTTCCAC TGATTTGATT TGGGGCCTCC TGTCACCTTC 24120 

AGGATAGAGC CCAAACCACT AGTCATGGCT GCCAGGCTCC CAGACACACT TCCCTTTTCC 24180 

AGCCTCTTCT CTTGGCCCTC TCCACTTGTA GTCCATGCCG TAGACTGTGC ACCCTGGACA 2424 0 

GTGTCACATA GAGTGCTATG GGGGTGGCAC CCCCTGAAGT TCAACAGCAC GGAAGCCCTG 24 300 

ACTGGTATGA CATGGTTCAA TGTCCAGAGT TTAATTTTAA GAATCAACAA CTAGACAAAG 24 360 

TAATGATATT GACTCAAACT TACTATTCAA ACCAACCTTT TATTCCTTAG GCTTGTGTAG 24420 

CCTGCCCTCA GAGAGAACTA TGATGATGGA CATTATCAAA AGGAATGAAA AAAGAATTGA 24 4 80 

CCTGTAAGAA TTTTTTTTAA TTCTTTACAT GAAGCAGTGT TTCTCAAAGT ACAGTGATCT 24 540 

AACTACTTAC AAGAACCACC TAGCTGCCTG ATAAAATGCA AATTTCTGGG CTATAGCCCA 24 600 
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GATGATTGAA TCAGAAACTC CGTGTGTGAG GCTAAAAAGT TGCATTTTTA TCTTCTTCCT 24 660 

AAGCGATTCT TATACATACT AGGTTAAGAA CCAAATACTT AAAGATAAGA ATTGTACCAA 24720 

ATCAGAGCAC TTCTCCTTGG CTTAATTTCA TTTCAGTTTT ATATGATGCC TATGTCAGAT 24780 

TCCATAACTT CTCAAGCCAC CTACACTCTG TGGTTAGAGA GGGAATGGGA TGAGACAGTG 24840 

GTGGTGATAG TAGCTTGAAT AGCTGTGAAA AGTTAGAGAA TCCCCATCAG AATAAATTAG 24 900 

GAAGGGGTTG GTGTGAAGGT TCAAGGATTT GTACTTTGTG ATGAGGTAAA ATGAGGTTCA 24 960 

ACAGTGATCG AGTACCCTTG GAAAGTTGAT TTGGGGCTTA CATCAGGTGT AAAGAGTTTT 25020 

CTCATGTTCA AATTCAAATT TACCTAAGAT TGATTGAGTA TCTACTATAC GCCATCCAGA 25080 

CTGCCAGGTA CTTTAGTAAT TTAACAAGCA AATATTAAGC ATCTCCTTTG AGCAAGACAC 2514 0 

CAAGCTATGC TTTCATATGC ATTATCTCAT GAATTCCTGC AGCCGCCCTG GCTAGCATGT 2520O 

ACTTGCCTGG AGATTTGCCA CCGCTTTW^ AATGCCAAAC AATGGTTACC AATCTTGTCA 25260 

CATTTCTAGA GCATCCATGA ATTCATGGCT CTTTATTTGA GGGCGTATTC TCAATCTGAG 25320 

ATATGAGCCT CCTGGTATGA TA/^CTCAAA CTTTCCACCA GAGATTCATT GAAAACTCAT 25380 

TCACATATTC ACTCATTCCT TCATTCCTTT AGCAGTTTTG AATGCCTAAT ATTCTAGAAA 254 40 

ACTTAGAACA TTCTGTGAAC ATTCCCTTTT TACTTTCTTC ACTAAGGTTT GGAGAAAGCC 25500 

AGAGCCAGAC GTTGCAGACC AATTATGTTG ACTACTTGGA CGAGCTCGCC TTAGAGATAG 25560 

GTGCGAAGCC AGATTTCTGC TCTCTCTTGT TCAAAGATCC TAAACTGGCT GTGAGACTCT 25620 

ATTTCGGACC CTGCAACTCC TATTAGTATC GCCTGGTTGG GCCTGGGCAA TGGGAAGGAG 25680 

CCAGAAATGC CATCTTCACC CAGAAGCAAA GAATACTGAA GCCACTCAAG ACTCGGGCCC 25740 

TGAAGGATTC ATCTAATTTC TCAGTTTCTT TTCTGTTGAA AATCCTGGGC CTTCTTGCTG 25800 

TTGTTGTGGC CTTTTTTTGC CAACTTCAAT GGTCCTAGTC AGCATAATGC TTTGGGCTTT 25860 

ATTATCTTGT CAGTCACTAC CTCCTAAAGA AAAAAAAAAA GGCTAGAAGA AAAAACATTA 25920 

CATTCATGTT CTAATTATAG ATTTTAGAGT TAGGTAGTAC AGGTAAGGGG GAAATTGTAA 2598 0 

AGAATTAGCA GAATTAGGCA TATGTACAAA ACCAAA 26016 
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(2) INFORMATIONS POUR LA SEQ ID NO: 2: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1731 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: ADNc 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 2: 

AACCAAGGGA GAAAACTATT CTGTCAAAGA GACGGTGCCA AAAGGCAAAA ACAAAGGAGC 60 

TGATGGCAAA GAAGGTAGCT GTGATTGGAG CTGGGGTCAG TGGCCTAATT TCTCTGAAGT 120 

GCTGTGTGGA TGAGGGACTT GAGCCCACTT GCTTTGAGAG AACTGAAGAT ATTGGAGGAG 180 

TGTGGAGGTT CAAAGAGAAT GTGGAAGATG GCCGAGCAAG TATCTATCAA TCTGTCGTTA 240 

CCAACACCAG CAAAGAAATG TCCTGTTTCA GTGACTTTCC AATGCCTGAA GATTTTCCAA 300 

ACTTCCTGCA TAATTCTAAA CTTCTGGAAT ATTTCAGGAT TTTTGCTAAA AAATTTGATC 360 

TGCTAAAATA TATTCAGTTC CAGACAACTG TCCTTAGTGT GAGAAAATGT CCAGATTTCT 4 20 

CATCCTCTGG CCAATGGAAG GTTGTCACTC AGAGCAACGG CAAGGAGCAG AGTGCTGTCT 4 80 

TTGACGCAGT TATGGTTTGC AGTGGCCACC ACATTCTACC TCATATCCCA CTGAAGTCAT 54 0 

TTCCAGGTAT GGAGAGGTTC AAAGGCCAAT ATTTCCATAG CCGCCAATAC AAGCATCCAG 600 

ATGGATCTGA GGGAAAACGC ATCCTGGTGA TTGGAATGGG AAACTCGGGC TCAGATATTG 660 

CTGTTGAGCT GAGTAAGAAT GCTGCTCAGG TTTTTATCAG CACCAGGCAT GGCACCTGGG 720 

TCATGAGCCG TATCTCTGAA GATGGCTATC CTTGGGACTC AGTGTTCCAC ACCCGGTTTC 780 

GTTCTATGCT CCGCAATGTA CTGCCACGAA CAGCTGTAAA ATGGATGATA GAACAACAGA 840 

TGAATCGGTG GTTCAACCAT GAAAATTATG GCCTTGAGCC TCAAAACAAA TACATTATGA 900 

AGGAACCTGT ACTAAATGAT GATGTCCCAA GTCGTCTACT CTGTGGAGCC ATCAAGGTGA 960 

AATCTACAGT GAAAGAGCTC ACAGAAACTT CTGCCATCTT TGAGGATGGA ACAGTGGAGG 1020 

AGAACATTGA TGTCATCATT TTTGCAACAG GATATAGTTT CTCTTTTCCC TTCCTTGAAG 1080 

ATTCACTCGT TAAAGTAGAG AATAATATGG TCTCACTGTA TAAATACATA TTCCCCGCTC 114 0 

ACCTGGACAA GTCAACCCTC GCGTGCATTG GTCTCATCCA GCCCCTAGGT TCCATTTTCC 1200 
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CAACTGCTGA ACTTCAAGCT CGTTGGGTGA CAAGAGTTTT CAAAGGCTTG TGTAGCCTGC 1260 

CCTCAGAGAG AACTATGATG ATGGACATTA TCAAAAGGAA TGAAAAAAGA ATTGACCTGT 1320 

TTGGAGAAAG CCAGAGCCAG ACGTTGCAGA CCAATTATGT TGACTACTTG GACGAGCTCG 1380 

CCTTAGAGAT AGGTGCGAAG CCAGATTTCT GCTCTCTCTT GTTCAAAGAT CCTAAACTGG 14 4 0 

CTGTGAGACT CTATTTCGGA CCCTGCAACT CCTATNAGTA TCGCCTGGTT GGGCCTGGGC 1500 

AATGGGAAGG AGCCAGAAAT GCCATCTTCA CCCAGAAGCA AAGAATACTG AAGCCACTCA 1560 

AGACTCGGGC CCTGAAGGAT TCATCTAATT TCTCAGTTTC TTTTCTGTTG AAAATCCTGG 1620 

GCCTTCTTGC TGTTGTTGTG GCCTTTTTTT GCCAACTTCA ATGGTCCTAG TCAGCATAAT 1680 

GCTTTGGGCT TTATTATCTT GTCAGTCACT ACCTCCTAAA GAAAAAAAAA A 1731 
(2) INFORMATIONS POUR LA SEQ ID NO: 3: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 535 acides amines 

(B) TYPE: acide amin6 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 3: 

Met Ala Lys Lys Val Ala Val lie Gly Ala Gly Val Ser Gly Leu He 
15 10 15 

Ser Leu Lys Cys Cys Val Asp Glu Gly Leu Glu Pro Thr Cys Phe Glu 
20 25 30 

Arg Thr Glu Asp He Gly Gly Val Trp Arg Phe Lys Glu Asn Val Glu 
35 40 45 

Asp Gly Arg Ala Ser He Tyr Qln Ser Val Val Thr Asn Thr Ser Lys 
50 55 60 

Glu Met Ser Cys Phe Ser Asp Phe Pro Met Pro Glu Asp Phe Pro Asn 
65 70 75 80 

Phe Leu His Asn Ser Lys Leu Leu Glu Tyr Phe Arg He Phe Ala Lys 
85 90 95 

Lys Phe Asp Leu Leu Lys Tyr He Gin Phe Gin Thr Thr Val Leu Ser 
100 105 110 
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Val Arg Lys Cys Pro Asp Phe Ser Ser Ser Gly Gin Trp Lys Val Val 
115 120 125 

Thr Gin Ser Asn Gly Lys Glu Gin Ser Ala Val Phe Asp Ala Val Met 
130 135 140 

Val Cys Ser Gly His His lie Leu Pro His lie Pro Leu Lys Ser Phe 
145 150 155 160 

Pro Gly Met Glu Arg Phe Lys Gly Gin Tyr Phe His Ser Arg Gin Tyr 
165 170 175 

Lys His Pro Asp Gly Ser Glu Gly Lys Arg lie Leu Val lie Gly Met 
180 185 190 

Gly Asn Ser Gly Ser Asp lie Ala Val Glu Leu Ser Lys Asn Ala Ala 
195 200 205 

Gin Val Phe He Ser Thr Arg His Gly Thr Trp Val Met Ser Arg He 
210 215 220 

Ser Glu Asp Gly Tyr Pro Trp Asp Ser Val Phe His Thr Arg Phe Arg 
225 230 235 240 

Ser Met Leu Arg Asn Val Leu Pro Arg Thr Ala Val Lys Trp Met He 
245 250 255 

Glu Gin Gin Met Asn Arg Trp Phe Asn His Glu Asn Tyr Gly Leu Glu 
260 265 270 

Pro Gin Asn Lys Tyr lie Met Lys Glu Pro Val Leu Asn Asp Asp Val 
275 280 285 

Pro Ser Arg Leu Leu Cys Gly Ala He Lys Val Lys Ser Thr Val Lys 
290 295 300 

Glu Leu Thr Glu Thr Ser Ala He Phe Glu Asp Gly Thr Val Glu Glu 
305 310 315 320 

Asn He Asp Val He He Phe Ala Thr Gly Tyr Ser Phe Ser Phe Pro 
325 330 335 

Phe Leu Glu Asp Ser Leu Val Lys Val Glu Asn Asn Met Val Ser Leu 
340 345 350 

Tyr Lys Tyr He Phe Pro Ala His Leu Asp Lys Ser Thr Leu Ala Cys 
355 360 365 

He Gly Leu He Gin Pro Leu Gly Ser He Phe Pro Thr Ala Glu Leu 
370 375 380 



Gin Ala Arg Trp Val Thr Arg Val Phe Lys Gly Leu Cys Ser Leu Pro 
385 390 395 400 
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Ser Glu Arg Thr Met Met Met Asp He He Lys Arg Asn Glu Lys Arg 
405 410 415 

He Asp Leu Phe Gly Glu Ser Gin Ser Gin Thr Leu Gin Thr Asn Tyr 
420 425 430 

Val Asp Tyr Leu Asp Glu Leu Ala Leu Glu He Gly Ala Lys Pro Asp 
435 440 445 

Phe Cys Ser Leu Leu Phe Lys Asp Pro Lys Leu Ala Val Arg Leu Tyr 
450 455 460 

Phe Gly Pro Cys Asn Ser Tyr Xaa Tyr Arg Leu Val Gly Pro Gly Gin 
465 470 475 480 

Trp Glu Gly Phe Arg Asn Ala He Phe Thr Gin Lys Gin Arg He Leu 
485 490 495 

Lys Pro Leu Lys Thr Arg Ala Leu Lys Asp Ser Ser Asn Phe Ser Val 
500 505 510 

Ser Phe Leu Leu Lys He Leu Gly Leu Leu Ala Val Val Val Ala Phe 
515 520 525 

Phe Cys Gin Leu Gin Trp Ser 
530 535 

(2) INFORMATIONS POUR LA SEQ ID NO: 4: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 254 64 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: double . 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4: 

TCCAGTCCTG CAGCAACCTC CTAGTTCCTG CTCTTTCAGC TCTTTGACCT TTTGCAAGCA 60 

CCTAATTCCC TGTAGTATAT ACCTTTCTTC ATGATATATA GTGTTTTTTA TCTCCTGCAC 120 

TAAATCATGA GCATATGCAT ATAAATCATA ATATGAAATC TTAAAAACAG AAGTACTTTT 180 

GCTGAGGCAT TAAGCATATA ATCAGTCAGC AGGTCCCCAA ACATCTAATT CCTGAATATC 24 0 

TCATATATCC TGTCTCCATT ATCCATTCCT CTAATGCTAC TCTAATTTAA GTCCTCAGTC 300 

TCTCTGGCCT AGATTGTTGA AATAACATCC TGGGTTTTTG GTCTCCTTGA TTCTAGTCAC 360 

CATCCTCTCT AGCCTCCAGG TGAATCTGAT CTTGTCTGAT GTTGTCACTT CCTTGTTCAA 420 
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AATTCTCGAA TGGACAACCG T7\ATCCAGAA GGTAGTATCC AAACCTGTGA TTGTGGCACT 480 

TCAGTATCCT TCATAACCTA TGTCCTGCAT GTTTAACCCA TATTTTGCTA TTCCCATCAC 540 

TTATGGTCCA GCAAAACTGA ACTAATTGTA GTTCCCCCAT CACGTGTTCT TACTTTTCTA 600 

TGCATTTTCA CATATTTTTC TCTCTGCCTT TTTTCTATTT CTTGTCCCTT ATCTGTCTGG 660 

AAAACATCTA TTCTTCCTTC AAGACTCAGC TGTCTTCTCA CACTCCTTGA AGCCTCTCTT 720 

TCCTCCTCCA AGTGGACCTA GATTTTTCTT CCTACATGCT AGCACTACAC TGAACCATAC 780 

TTCCACTGTG ACATTTATCA TCTCCCTCAA CACTAGACTT CATGGTTCCA GATGGAAAGC 84 0 

ACTGTGTCTT CTCACCTTTG AATCCCCCAA AAGACTATTA TAATGCATGA CATATAGTAG 900 

GCTGTCAGTA CAGTGAAAGG AATGGCCAGA GGAAGGAAAG GAGGGAAACA GAAGCAGAAA 960 

GGACAGGTAT AGAAGCCGGA GGGAGCCAGA GACAAGGTTC AGAGACCACA ATTCTGTCTT 1020 

TTGAGTTCAC TAGTTTTACA AGCTCATCTA TAAGCGTTAG TTCAGCAACT CAGATCAGGC 1080 

CCTAAGTTTC CAGAAATTTG AGCTACTTTT CACTGTTGGC ACAACAAAAC GTTTCATTAT 1140 

AGTCCAGGTG CATAGCCTTT GTTTATATAT TCTATATTTC CAAAGCAAAC ATAAATGAAA 1200 

GAATCATTGT TCCCCTAATC TCCCAGGAGT TTCACCTTAC AGCTCCAGTG GCCATGGCAG 1260 

TCACTGTTTT ATATTTTTTG TAACAAGAAC CAAAGACTTC ATTCTTCCTT TTTCCTACCC 1320 

CTTTCTTTTT ACTTCACCCA TGCCTCCCCT GTTCTTCTCT TATCCCTACC ACACTCGTCC 1380 

TTCTCTTTCA GATTTTACTA TGGCTCTATA CCATTAAAAA TACAAGAAAA AAAAGGAATT 14 40 

TTACTTTAAG AATAACTCCT CCCCCTTCCC CAGTTTTCAC ATCAAAAGAC ATTGTTAAAT 1500 

GCCATTCTCT TCCACATTTC GAGAACTGCT GATTCTCTGG GGAGAGAAAG GTGATTGCTT 1560 

AAGAGGTGAA GTCCCTTAGA GCATTCAAAA TGAGGAGTGA TTCTGTACAG AGGATATCAT 1620 

GCAGCAGGCT GGATGTCTAG TTCCAATTCC TTTATTTGTT ACCTCTGAGA CCTTGAAGAA 1680 

GTAGTTTCTA GTCTCAGCAT ACCAAAGCGT CATCTGCAAT TGAGAGCATT GGATTGATGA 174 0 

TCTTCAAGGT CCTTCCTGCT CTAGCATTCA CTGAATCTGC TATTTTTGAC ATATTGAATA 1800 

ATCAGAAGCA GCCAGTTTTA GAATCTTATT ATAGCAAAAG TGGTAAAAAT AATGAGCATA 1860 

TACTATCAAT GTGCATCTAT GTCTTCTTAT GTTTGAGTGA GGATCCTGAT ACATAAACCT 1920 

TGGCTGATAA TTTCTACTGA AAAAAATCGT AAGTATTAAA GACACTCTTC TGAAGATGTT 1980 

CTCTCCAGAC TCTGCTACAG GCAATCATGA GCAAGAGGGT TGGCATCATC GGAGCTGGAG 204 0 
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TCAGTGGCTT GGCTGCCATA TGGTGCTGTC TGGAGGAGGG GCTGGAGCCC ACTTGCTTTG 2100 

AAAGGAGCGA TGATGTTGGA GGCCTGTGGA AATTCTCAGT GAGTGGCACA TCATTAGAAC 2160 

ACCAGTGGAA GGAGATGGAT TCCAATGCAA ATCAAATCTG ATCAGTTCTA ATTCAGATTT 2220 

AGAAGGCAGA TCACAAAAGC TCCAAATCTG GAAAGTAAAA TCTTACCTCT CCAATCATAC 2280 

TAATGCCCAA AAAAACTATT TCATACCAGC AAAATTTGTC CTGAAAAGGA CATTTTCAGC 2340 

TCATTAAACA TCATCACCTG CATGGTGAAA TCCAGATCTC CAAGCTGTAA AGGGCACTAA 24 00 

TGTTGGTAAT TAGTCAAAAA TATACCATGG GCTTCCCAGG TAAGTGAAAC AATTCTATTC 24 60 

TTTATTGCTC TTAAATGCCA GGAACACGAC TAGAAAAGAG ACAAACAAAC CTGGACTGAG 2520 

ATCCTGAGGT CAGAAGTCCT GAGTTCTAAT TTCAACTTGT AGGTTTTCTA GGCAGATAAG 2580 

ATTTCAGTCC AGTTGCTTTT GTTTCCCTGG ACCTCAAATG CTCATTTGTC AAATGCAGAG 2640 

GATATGATTC TATAATTAAC TTATGTCTAT TGGGCAGATA GAAATTATTA TAGATGATGA 2700 

TTGTGTGTGC GGCTGTTGAA TAGCCTATCA GCTCCAAATC CAGAGGGAAA AATTATGGTC 27 60 

TTTGCCATTT GGGCTCATTG TAGAAATAAT ATAATTAGGA AATAGTCCTT GTAAACACAT 2820 

TTTTTTTTAA ATTTCAAAGC CAAGTTTGGA GAAACTTCTA GTTCTTCTGT CCTGGATTTC 2880 

CCAGCCATTG TAATCAGTTG TCGATGATAC ATATTTGGCT TGAAAACATA TTCACATCAT 294 0 

TCATATTGTA ACTACTTCCT GTCCTGGTCT CAGTTACTGC TCTGCCTGCG CCAATAGCCT 3000 

CCTCCAATAG AGTATATCAG TGCTAACTTA GAACACATTT TTATTCTTCT CCAAGCTTTT 3060 

TTTAAAAAAA ATTGTGGTTT TGTAACCCTG AAAGCACTCC ATGAGATATA AGGTCATTAA 3120 

TTTTTATTTC CCAGTAGGGG GTAATCAAGA GTTAATATTT TTCAAGAATT TAATTTTCCC 3180 

TATTTACATT TGCTCAGGGA AATGTGGACA GCTTAGAGTA AATCATAAAA TGGCTTTCTA 324 0 

CCATCTCCCT AGTAACAATT AAATGATGCT TGAGCATCTA TTCTGGTAGT TTGTGCTAAG 3300 

TACTGGGATG ACAAATATGG 7\ATATAATCA CTCCTTGTAA ATGGTTCCAT TTCATTTGAT 3360 

TAAGCAAGCC ATAATATAAT TCCGTAATCC TTTGATAGCA AATGGGCAAA AACTCATTTG 34 20 

ATAGCCGAAC CTCTTCTGAA ATCGTAAGGT TAAATACCGT GAATTGGATC AACATGAAGC 34 80 

TAAGTCTCAC CTTCTGTTGC ACGGCAGAAA TTTTATTGCA TTTGACAGAT TGCTGCCCCA 354 0 

GATCTCACTA GGAGTATTAT GGAGCAAAAT CCAAAAATGT ACACATTCCA AAATATATCT 3600 

GGCCCTAAGA CTTTTAAAAT AAGAGATTAT ATAACTACAA CAACAAGATA GACCTTGTCA 3660 
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CCATCAATTC AATGGACGAG TGCCTCGAGC GTTTAGAAGA GGGTGGACTA CGGAAATCTT 3720 

AGTAGGTCAA AGAAAACCTC CCACAGGGAT GACACTTAGC CTTGAAGGAT AACCCCAGAC 3780 

AAGCAAAATA GAGGACCACC TGTGACACAA CTCCTAGAGA GTGCATTTCC CAATAAAGTC 3840 

TGCGAATGGC ACTCCATAGG CCTATGCAGT CATTGGCAGT GTGCCAGCAC CAGGTTAAGA 3900 

GAGACCAACA ATCCATGAAA GGCACAGAAA AGGCAATGAA CATGGTGTGT GCAGAGAGGG 3960 

ATCCATGAGT TATCCAATAT AGCCAGATCA GAAAGTTTAC TTAAGGAAGC AATAATATGA 4020 

TACAAAGATC AGTAAGATTC AAAGTTGGAT TCTGAGTTAT CCACAAGAGG AAATTCTTCT 4 080 

TTTCCATAAG GTCATGTCTA TAAGCAAAAT TCTACTCAAA GTCCTGGTGA GGATATGGAC 4140 

CCATACAAAT ACTCAAAACT TTAGCCTCCT CCACATACCC CAGCCCTTCC TTCTTTTCTT 4 200 

AGAAAAGTTG CTTGGCACAA TATATAATCA GAGAGGGATT TTTTTTATGT GTTACATAAG 4260 

ACTTTATCTT GTAAGCCTTT TTTAGAAGGT GTTCTAGCAG ACAGAAACGT GGTAATTCTG 4320 

AACTTTTCAC TATTTGCTTT TTCTGAGAAA TGAAAACCAA ATGGGATTTA AATACTAGCA 4 380 

GGCTGAATGT GTGTTTTAAG TTTCATCCAC TCCTAAATAG GGCCTCGTGT CCTCAAAAGA 444 0 

TTTCATTACT GCTGTAATAA GAAGTTGCTC AACAGCCAGG TGCGGTGGCT CATGCCTATA 4500 

ATCCCAGCAC TTTGGGAGGC CAAAGCGGGT GGATCACGAG AGGTCAGGAG TTCAAGATCA 4 560 

GCCTGGCCTU^ CACAGAAAAA CCCCATCTCT ACTAAAAACA CAAAAATTAG CCAGGTGTGG 4 620 

TGGTGGGTGC CTGTAATCCC AGCTACTCAG GAGGCTGAGG CAGGAGAATC TCTTGAACCC 4 680 

AGGAGGCAGA GGTTGCAGTG ACCTCAGATC ATGCCACTGC ACTCCAGCCT GGGCAATAGA 474 0 

GAAAGACTCC ATTAAAAAAA AAAAAAATGC TTACCAATAG GTTAGTAGCA TTTTGATTGC 4 800 

AAAAGCTGAA GCCAGGACTA TTTGAACTTT TTCCCACTCA TTTATTCCTT TGTTCATTCA 4 860 

ATGAATACAT ACTGTGTACT TTATGTGTAG GGTACTATAT TAAGCATAAG CTGCAGATAA 4 920 

GAGGCCAGCC AGCACTTTAA AAGCCGTGAG AAAACAAGTA TCAGAATAAC TATAAGTGAC 4 980 

TATATAATTA GGGCAATAAG GATAATGGGA CCTTAGTAAA ACTAAAGATG ATTTGGCAGT 5040 

AGCTGAGAGG GAAGGTAAAG AAAGCCATGA CAAAGTTGAA GGCAACTTTT GAGCATATTT 5100 

CAAGGGCATA TTTAGACAAG GAGATATGGG ACTCATAAGC AGAGCTGGAA TAGGAAAGAA 5160 

GATCAAGGTA AACTGCTTAG ATGCATGTAC AACATTCTGA AATTAACCTC TGACTTTGCC 5220 

CTCAAGTTAC TTATGTTCTC GTGGGAAAGA TGAGAGATGA ACACGGTTAT CATCCAAGAC 5280 
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AGATGGTGCC CACAGCTGCT TAGATCTCTG GTTCCAGGGT T^GCTCCCT CAGCTAGAGG 5340 

CAGAGTCAAA GTTGAATTTC CTCCTTACTG GCTCAAACCA CACCTCATAT TGAAATAATA 5400 

AAAATGCATG CTCCCTGGAG CAACTGACTT GTTATCTAAT ACATTTGCTT TTTTGTGTTC 54 60 

ACTTGGAGAA CAGTCTTTTC GGAAAAATTC CAAGGAGCTG TAGTGTACAT ACTCTTCTCT 5520 

CCTGGTGTTA TAATTGGCTG AGGTCAAGGG GCAAAAAAGC AGAGATTCAT TCAAGATGGA 5580 

AATATTCCAA GGCCTTAGCA TCTGTTTCCC AGAACAGAGT CTTACATTCT TTAACCAGGC 5640 

TCCATCCCAC AGTTCAGCCC TGCCTCCTTT CAACAGGCAG CTGAAAAAAC CTCCTTCCCA 5700 

CCTCTCCTTC TCACAACCAT CAGTAGAAGG CGCTAGCTGT GGGTGAAAGG GAAGCACTCA 5760 

GCCTGCCAAA CTGCTGGACA TGAGCCTTCA CCCTTTTTCT GACCTCCACA AAAATTTTAA 5820 

AAAGTTTAAA TTCCTGTGCT TCCACGCTTA TGAGAAATAC AGCAACCATG AATAGAGGAA 5880 

GATTATGTTT TCJ^ACTTGAG AAAAAATACT GAGGCTTTGG GCAGCCCCCC ACTTCCCCAC 5940 

GGGGACACAA TCCTCTCAAC CCTTTCCAGC ACTTTTTGTT TCCCTCTTCC AGAGGTCATC 6000 

TGGTGTGAGA GGGAGATACA CATCTTGAAT CCAGCAGCAA CGTGACATTC CATCTCTTTC 6060 

CCCCCATTGC ACAAGAGTCC CTTCCGGACC TCGGGAAGCA GAAGCTGCCA GCTCTGAAAT 6120 

GTATTTTCAA GGCAGCACAT TGTGTGCACT TTTACCCTAC CCTCACAACT GAGAGGAAAT 6180 

GTTTATTTTC AATTTAGCTT TTGACTGCTT CTAAAAAATA AGCCACTTTT CAATTACACA 6240 

GAGGCTTTAA AATGAAGTGC CAAGATTTAA CACATGTTCT AAGGGCTCTG GTTTCCTGTG 6300 

TTTCTTTGGT GAGGAGTGAA GTCCAGCAAC TGGTGAGCCA AAGAATAGGA TTCATTTACA 6360 

ACAGAGCAGT GGTTCTCAAA GTGTGGTTCC TAAACCAGCC ACATCAGCAT CACCAGGAAC 6420 

TTGATAGAAA TGCAAACCAC CCCAGACTCC ACCCCAGACA GATTGAATCC GAAATTCTAA 6480 

GAATAGGGCC CAAGAATCTA CGGTCTAGGG AGCTTCCAGG CGATTCTCAT TACGCCAAAG 6540 

CTGGGAAACC ACTGCAATAT TGGGTTGTTG CCAGTGAAGA GTTTGCTAAA CTCCAAAAGC 6600 

AAATAAATAG GCTAGAAGTC AGAGCCTCTT CTAGACAGTT TTGTTTTTTG TTTTTTTTTT 6660 

AACCTGAGTA TAAGATCAGA ACCAGTGGTG GCACAGGAGA AAGCAAAAAC CACTAAGTGG 6720 

CTATAAAGAC AGAGCTAACA CTGAGGGTAA TTACAGTAAG AGGATTCACA TGGAAAGAGC 6780 

TCCAGTTCTG TGCCAGGTTA CGCGAAGGGC TTTCCATTCC TTATCTTACT GAGAGCTTTT 6840 

AATTTTTGTT TACGCTTTTA AACATGAAAA GGGTTTTAGT CAACCAAGAA TTGAACCACT 6900 
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GTGTTCACTG AAGGGAACAC AATTCTTGGC TTTCTCTTTA AGCTTTCTTA TTCTCCCTAG 6960 

GACCACACAG AAGAAGGCAG AGCCAGCATT TACCAGTCTG TATTCACAAA CTCTTCCAAA 7020 

GAAATGATGT GCTTTCCAGA CTTCCCTTAT CCGGATGATT ACCCAAACTA TATACACCAC 7080 

AGCAAGCTCC AGGAATATAT AAAGACATAT GCTCAAAAGA AGGATCTTTT AAGATACATA 7140 

TAGTTTGAGG TAGGGGTCTC ATAACTTGTA CTGTTGAAAT TAAGATATGT GTGGGTTAGA 7200 

GAAAAAGGAG GCAGCAAACT ATTATAAAAA TTAGAGCCAA ATGTTTGGGC ACCTCAGTAA 7260 

TCAAATGTTG GGTCTGATTA TAAAGCATTC ATGCATTGAT TTTTTCTCTC CTAGACTTAC 7320 

TAGTTCACTA GTCTCTGAGA GCTTTCAGAC TACCTTAGAA AATGGAGGCA GCTAGCCCAT 7380 

CATTGTCCAC TTTCCACCCT CATGCTCTGA TGTTTTGGAA ATAATCCAAA ATGCTTTAGT 74 4 0 

ATATATTAGG AATTTTGTCA GTTCAATGCC AATGAGTTGT GGTTCAAAAA ACCAGAGCAT 7500 

TTGGTAGGGT TTCTCCCATT ACATTATGAA AAGGTTAACA ACTTAAATGG GAAATATAGT 7560 

CATTGCCCCC ATCTTTACCC ACTCAGTTCA TTAGTTTTTT TATTAAAAAG GTGAGATTTC 7 620 

AGCATTGTTT CTGCGAGAAT AATGTTTTAC ATTTATTTGG GACTCTTTAT TGAGCATTTC 7680 

TGTCTGTATG TTTGGAACTC TTAACCTCAA TTAACTGCTG CTAAATGCAG AACACTTGCA 774 0 

TATAGTGGGA AAAACAATCA GCAAAATTAT GAACCATGGT GATATTTACA TCATTATTTT 7800 

ACCTGGAGTA GCCCCAAATG TATAGTTAAA ATAAAATTTT CCAATAGTCA TTTTATTCCA 7860 

TTCATTCATT ACATTCATTT GCTTCCATTA TGGTGTTAAT ATCAACAAAC ATTAATGAAG 7920 

TTCCTATTGT GTGCTTGCAT TGTGCTATGT GTTATATGTA AAAGAAAAAG AGGTCTAAGA 7 980 

CTTAGCTCTC AAGAAGTTAT TTCAAAATAA ATATGTAAAG AGTAAGTAAA AAGATTCCAG 804 0 

TAACAATTTC AATCAAAGAG AAAATTTTTT AAAGCTCTTT ATGATTTGTT TATAAATAAA 8100 

ACAATGCTAT GGAGATCATG AAGCAAGAGG CAACACTTTG GGGGAAGGTA TTTTCTAGAG 8160 

GAGGTAAAAT TTAGTTGTAT TTAGTAGGTG TTTTAGATAA ATGAGTGGCA TGAGTAAAAT 8220 

TAGAGAGGTG GGAAAATGCC CTGCTCATTT GGAGAACAGT GGGCAAACCA AGTTGGTTAG 8280 

GAGGGAGATA TATATGCTAG GATGAGATAT GGCCACATAT ATCAGTAAAC TAGTGTGTAC 834 0 

TGTGACTTTG AAAAATAGAG GATTATTTTG CAACCATGTA AAAGAAGTCC AAAGAAGGGA 84 00 

CATCCAGAGC TTATGTGATG GCACCAAAGT TATCAAAGAT TCAGCTTCAC CCATCTTAGC 84 60 

ACGTGGCCTA CATCATGACG TTTGCCTTGT GGTGCAA7VAC AGTTGCTGAA GCTTGAGCCG 8520 
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TCACATCTGC CTTCTAGCAA AAAAAAAAAA AAAGTAAAGA ATGAAGGGCA AAGGGATGTT 8580 

CTCTCAGCTG AATCAGCTCC CCTTTTACAA ATTCTCCTGA AAAAACTGTC CAACATTGCT 8 64 0 

TATATCTCAC AGGCCACCCT AGTTGCACAG GAACCTGGAA AATGCATCCC TTTTCTGTGT 8700 

ATGTTGTCGC TCCAAACAAA ATCAGGGTTC TGTTAGTAAG AATGAAGGGA GAATGGACAT 8760 

TAGGGAAGCA ATTTGCAGAA TATGTTCCAG AAAAGTCTGT GGGAATAACA GAAAATAAAA 8820 

CTAAAAGAGT AAATTGGAAC AAAATTGTAT GGACTTAATA GTAATCGCAT TCAAAATGTA 8880 

GAATAAGTTT TAGAGGCTGT GAAGTAACAG AAATTGAGCA GTGAATTGAG CAGAGAAATT 8940 

GAGAAATGAA TATAGTCCTT CAGGAAGATT AATCTGACAA GCAGGACAAA GGATGGCTTG 9000 

TAGGAAATGG GAGGCTGAAG ACAGGCTAGG TATAGGTTCT TGCCGTAGTC CATGCAAGGG 9060 

AGTGATAAGG ACTTGAATGA AGGCAGTGTT AGCAATCATG GAAAGAAAGC GTGAGATTGG 9120 

GAGATAAATA CTGTTTAAAC ATGAGGCAAG GATGGAGAAA TAACAAGGAA AACAAGTCAT 9180 

GGATTTGAAG CATAAGTGGC TGGGAGTTTC ATGTCATCAT TCAT^GAAAT AAGAAAGTCA 9240 

GAAGCCAGTT TCAAAGGAAA TTTAAGTAGG TCAATCAAAA CCTGCTACAT ATGAGGAAGT 9300 

ATTAGGTGGC CCTCCAGATG GAAAGGTCAA GCTAAACTGG ATAGAAGAGA GACCAAGGAT 9360 

AGATGTATTT GTATATTCAT ACCACAAAAC TTGCTAATTT tTTTTTTTTT TTTTTGAGAC 9420 

GGAGTCTCGC TCTGTCGCCC AGGCTGGAGT GCAGTGGCGC AATCTCGGCT CACTGCAACC 94 80 

TCCGCCTCCC GGGTTCACAC CATTCTCCTG CCTCAGCCTC CTGAGTAGCT GGGACTACAG 954 0 

GCGCCCGCCA CCACGCCCGG CTAATTTTTT GTATTTTTAG TAGAGACGGG TTTCACCATG 9600 

CTAGCCAGGA TGGTCTTGAT CTCCTGACCT CGTCATCCAC CCGCCTCGGC CTCCCAAAGT 9660 

GCTGGGATTA CAGGCATAAG CCACCGCGCC TGGCCGTAAA GTTGCTATAT TTCTAAGATA 9720 

AGAGTATTTA TGCAGAGCAA AAGAGATGCC AACGATCAAA CCTTGAGATA TTCCCATACT 9780 

TATTGAGTAG ATGGAAGATG AGGTCAGAAA AGGAGGAAGC CATGTCAGTA GAGGGTAGCC 984 0 

ATAAGAAAAT AACACAGATT TGTTATATGA CATCATTCAC AAAAATATTC AGTGTGATTT 9900 

ACCCCTAAAT CAACTAACTT GATGTCAAAA AGTAAATGTA CTCCAGTGAG TAATTTTTCT 9960 

TGTGAGATTC AAAGACTCAC TGAAGATTCA CTGTGACTCC AATTTTACTA TCTTTCTATA 10020 

CATTTCTGAA TGACCAAGAG AGCTCGTAAC AATTATTTCC TCCACAGAAA CAAGGCAAGA 10080 

AGGAAAAAAA CTTTCACATG TAGAATTATA AATGGAAAAA TAAATTTTCT AGTTTTCTTA 1014 0 
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AAGACCCTGG TTTCCGGTAT AAAGATVATGT CCCAGCTTCT TAGTCACGGG CCAATGGGTT 10200 

GTTGTTACTG AAAAGGATGG GAAACAGGAA TCTACTATTT TTGATGCTGT AATGATTTGT 10260 

TCAGGACATC ACGTATACCC CAATCTGCCA ACGGATTCCT TTCCTGGTAA GTTTGGAAAA 10320 

TATATAATAA TCTAGGGACT TATATGCAAA CATCAAGAGT TAGAAACATA TCTTTCTATA 10380 

GGTATTACAT AATGATTATT CTTAGATTTC AAAAGAAAAA AATTAAGTTT AATGATAGGA 10440 

TATAGTAATA AATAGCCTCA TAAGTCCTTA TGTTAAAATA ATCAAGGACT GCAAGCCAGA 10500 

GATCAGACAA ACACAAGTTC CTGTGTTACA GACAGTAACT CAAATATAAG TTCTAACAGC 10560 

ACACGGGGTC TCCGAGCACA GTTACATTAA AAAAAAGTAG AGTCCAACTG CCAAATGGTT 10620 

TAAAGAAAGA CACGTTTACT TATGTTATTT ATAGGAGACT CCTAGGTTTC TAATTTCATC 10680 

TTCATCCACA ATTTGCAAAT AAACTTTAGA AATCTCAGTG ATTTGTGTGT GGGTACACAC 10740 

ATGGGTGTGT GTATAGCAGC ATACTTCATT ACCATCCGAA AGTGGCAAAC CTCAAATAAA 10800 

TACAATATAC ATGGAGGCTT CCTTCCATTT TTCCTTCCTT CCTTGCCACA GGAACACAAT 10860 

CTACTCAAAG ATATTAGAGT TTCCATGTCT AGGTATGATG TCCATAGGCC GAGGAAAATT 10920 

AAAGAGTGAA GGTTCAGGAG GAATATAAGA TTAAAACTCT TAATGTTAAC GGGCAGCATA 10980 

TTTAATGTTT ATGAGCATGG GATCAGAACA CCTGGCCTCA ACTTACTATT CCACTAGTTC 11040 

CTTACCACTT AACTTCTTTG TCTCAATTTC CTCTTCTTTT AAAATAGGGA CAATAGCCCA 11100 

CCATGCAGGG ATGTTATCAA GATTAAATAG TTAAAACGTG TAAAGCATTT ATCAGAGGAT 11160 

CTAGCCCACA GAGTTAACTT AATAAATATT AACCATTATT ATTATCGAAA CATACATTCT 11220 

CATGCCTTAA GATTTTTTAA GGAACTAAAA GTAAGTTTTA GGGGGCTTAA TGTCAAAAAA 11280 

TGCTAAATGG ATAAATGCAC TTCAACTAGG GAATTTTTTA ATTACAACTG ATAATAGGTT 11340 

TAAAAAGACA CAAAGAAAAC ATCTTCATAA TTTCTGAAAA TCAGTTCAAA CAACTTGCCA 114 00 

TGTTCCACTT AGGCCTGGAC CAGTTTCGAG GCAACTACCT CCATAGCCGG GATTATAAGA 114 60 

ATCCAGAAGC CTTCAAGGGG AAGAGGGTCC TCGTGATTGG TCTGGGGAAT TCGGGATCTG 11520 

ACATTGCTGT TGAGCTCAGC CGTCTGGCTA CACAGGTACA TGACGTAAAG GTTTTGGGAA 11580 

ATAAACCTAA GGTAGGGCTG TGCTACTAAA TCAGTAGCCA AGGCACAGAG GATGGTACTT 11640 

CTATGTCACA CCACAAGAGA TCCACCTCTT CTATGTGGCC CTTCAAATCA AGGAGGACTT 11700 

GAGACATCCT CCATGTGAAG CCAGGTAATG TGGCCCGTGC TAGTAAGGAA GTACATTCCA 11760 
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CTGAATCCAG AAGTAAGTGC ATGAGTGCGT GTATGTACAG ATGAGTGTGT ATGTGTGTAT 11820 

TTCTTGTTTT CATTTTATAT TCTGATCACC TCCAAATAGA CTAGTTCCTG GTCAGGCTTA 11880 

ATCTTTATTT ATTTAACAGT ATTTATTATA ACGTATCATG CAAAAAGCAC TGTGTTTACC 11940 

ACTCTGAAGT TCTGAAAGAT ATGCATGACT TGGTATTTAC TAACATTAAT TCAATCAACA 12000 

GCAGATGCTC AACAAATATT GGGCACTTAC TATGCTTACT ATGTGTCAGA ACTATGATAA 12060 

ACTAAAAATA AATGCATAAA TAAGTTAGAC TAGTTCCTGA CTTCAAGAAA GAGTCAATGG 12120 

ATGGAGATGG AGTTGACAGG TACACACAGA CTATCACCAG AGGAGATGGT GAGTCTTCCA 12180 

GTAGAATTAG GTGTGGCAAT AGCAACACAG GGAAAAGAGA ATCTAACTTA GCCTGGATGA 12240 

GGTCAAGGAA GACTTCCCAG AGGACTCCTW^ GCTAAATCAT GTATCATCGA TAGACCCTAA 12300 

AGAAACAACA TATTTTTAAG AAAACAGGTT CTCAATAAAT AAATTCTTAA ATGGATGTAA 12360 

ATAAAACCTT AATTTTTTAA ACTAAAAATT CCCTTCAGTT ATCACAAAGT TAAAGTCTAT 12420 

TTTGCAAAGA CGGTAAAATA GATAAGCAGC CAGACTCATC TCAGGGCTGA GGCGGTTGCC 124 80 

ATGGTTTGGG TTGCTCAGGA GAAGTCCTTG GGGTATGTGT ATAGGGAGAA CTGGAAAAGG 12540 

CAACCAGAGA CAGAGAACAG AATTAAATCC TTGACATCTC GTCAGCCTAA TTTCAGCTAG 12 600 

AGATTTAGCT ACACTTTTCC CACACCTAGT CCACTATCAC CAGCCACAAC CACTGGGGCT 12660 

CACTGGATCA TCTGGTCCCT ACCAGACTTG CCATCTTAGT CTATGAGTAT GTGAAGATTA 12720 

AACCATCACA GTTGAACACA GAGCCCTGTT GTTCCTAGAG TGATGATTCT AATCCTTTCA 12780 

ACAACTACAC ACCAGCCCTC AGGGGCAGTG AAAGAATCCT GTCTCTACTA GTTTAAATTT 12840 

TAGACTTTAA AAAAAATTTT TTTTATTTTA AGTTCTGGGA TACATGTACA GAACATGCAT 12900 

AGGTCTGCAC ATGCCATGGT GGTTTGCTGC ACCTATCAAC CCTTCATCTA GATTTTAAGC 12960 

CCCACATGCA TTAGGTATTT GTCTTAATGC TCTCCCTCCC CTAGCCCTCC ATCCCCCCGA 13020 

CAGGCCTTGG TGTGTGTTGT TCCCCTTCCT GJGTCCATGT GTTCTCATGA TTCAACTCCT 13080 

GCTTATGAGT GAGAACATGC AGTGTTCGGT TTTCTGTTCC TGTGTTAGTT TGCTGAGGAT 13140 

GATGGTTTCC AGCTTCATCC ATGTCCCTGC AAAGGACATG 7VACTCATTCT TTTTTATGGC 13200 

TGCTAGACAA CTTATTTAGA CTCGCCTTTT AAAAGTGTTC CTACTTGGAT ATTGAGGAAA 13260 

ATGCACGGAA GTGCCCAAAG AAGTGTGTTG TGTTTGCTTA TTTCTTACAG AGTAATGCTG 13320 

AAATCTGTGT TGCTTTTCCC CACCAGGTCA TTATCAGTAC CAGAAGTGCT TCCTGGGTCA 13380 
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TGAGTCGGGT CTGGGATGAT GGCTATCCTT GGGATATGAT GTATGTTACC CGCTTTGCAT 13440 

CCTTTCTCCG GAATGTCCTT CCTTCATTCA TCTCTGACTG GTTATATGTC CAGAAGATGA 13500 

ACACGTGGTT TAAGCATGAG AACTATGGCC TGATGCCTTT AAATGGGTAC TTAAAAATGG 13560 

AAATTTTTTT TATTCAAAAA AGGGGGGCAC TCATTTAATG AATTTATTCT CTCTAGAACT 13620 

TACTTTTGTT GTCTCATTGA GCCTAGAAAC ATTAAACTCA AGGTTTCACA GGTGACGGAA 13680 

TATGCCCAGA GACCACGTAT GGCTTGGAAA ACTTATTGAA ATTAGTCCAG TACAGAAAGG 13740 

GTATGGAAAA ATCTGAAATG GAGATGACGC AGGCAGATAA ATCACCCTGA CATGCATGAT 13800 

GCATTTGTGG TGGCTACAAG CTATAGCATA GAACTTTGAG GACTGAACAA ACTCAAATTG 13860 

GTTTTTGGAA GAATATCTTG TCCGTGCTTA TGGGTGTATG AAGACATCAA TAATAATACT 13920 

TGCTTCTCAA GATGGTTGTG GTATTCAATA ATATAAAAAT ATAAAAATTG CTTTCTAAAT 13980 

GATAAAGCTT TAAAAAAATT GGTTCTTCTT AGTCTCAATT TTTCTAATGT GCTTCAAAGG 14040 

AGCAAATAAC AAAATAGTGT TAATCAACAT GTCTCAGCAA GTAGGAAGTC TCAAAACAAA 14100 

AGTGCACACT TCCTCCACCC CTGAAATGTT GACATTTTTG CAGAACCATC AGGAGGCATG 14160 

GAACACATAA AGTAATGGAG AGTCACAACT AACGTGGCCT GTAAGATTAG TCAGATTCAT 14220 

TTATTTACTT CTTTATAGAG ACAGGGCCCA ACATTTACTA ATTAGGAAGT CATTCCAGGT 14280 

AGAAGAATCA GCATATCAAT AGAAAAAAAG AATATTTAAG TTGGTAAGAA AAGAAAGAAT 14 340 

TGAGAAATTT TATCTCCTGG CCCATGCTAG CCAAAAAGTT TCATTGTGTT TAGAGAAAGA 14 400 

TGGTAAGAAA AAGGAGGAAC TGTAAATCAA AAGAGCAAAT GCCAGATTTA GGAGCTAAAC 14 4 60 

TGTCAGTCCA AAGCACTTAT ACTACCAAGT CTTGCAGGCT GCTATAACCC TTTAAAATAT 14520 

GTTGATTTTA TGCATTTAAA ATTATGTTTA ACACTGTGGC TTGCTTGACA GTAGAGGGTG 14580 

GGAGGAGGAA GAGAATCAGA AAAAAATACT TATCAGGTAC TATGCTTATT ACCCAGGCGA 14 640 

CAAAATTATC TATACACCAA ACCCCTGTGA CACACAATTT ACTTATATAA CAAACCATGG 14700 

ACCCCCAAAC CTAAAATAAA AGTTTTTAAA AATTATGTTT AATATAGTAA GTCCCATAGC 14760 

TTGAGCTGGT TAAGATTTTT TATCTTGTAA GAGTAACTAT AAATTATATT TTGGCCTTGC 14820 

CATTTAGACA ATTAAAACAT AGTTTTAGAA ATTCATTCAT TCTGAAAACT AAGCTTCCTT 14880 

TTGGAAAGGG TTCCAATTAC CCTAAGTTTC TGGAGGGAGA AAGGGGGAGG AAAAACAGGT 14 940 

TTCATTGTGG TCTATGTTTT GCTACCTTGT AAGGTAAAAG AAGAGGTTGC AGGATTAGAT 15000 
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AAACAGAAAA TGATGTGGAA GTATAGAGAC AAATTTCAGG ATTTACAAGG TTTCTTTGTG 15060 

TCTGAGATAC TTGCAGGAAA TTCCGGAATC TCAAAGGAAA CTTAAATCAA AATGAAATAT 15120 

ATTGTCCTGA AAAATATTAT TCCTAGAATT TTGGCAACTA AAATGCAATA TCAAAGTTGT 15180 

TACACTTTTT TGTGGACACA GCTGATGAAA GAAAACCAAA CATGGCAATA AAACTTCCCA 1524 0 

CCACTGCAAG TCTGATTTCT CCATGTAAGA CAAGACGTTA AAGTTATGAT AATAGTGCAC 15300 

TTATAACAAC AGTGCTTGCA TGTGCCAGGA ACTGTTTTAA GTGCTTTAAG GATAATTGAT 15360 

CATTTAATTT TCACAACAAC CTATGAGGAA GATTCCATCA TCATCCCCAT TTTACACATA 15420 

AAGAAACAAA TACAGAAAAG TAACAACTAG TAAGAGATGG AGCTAGGTTA TGAACCTGGG 154 80 

CCATCTGCTT CCAGAGTTGG CGTTCTTAAC CACTTTAGTA TGTCTATAAA TTAGTTTTAG 15540 

TCTCATTTAG GAAAGGAATT GCCATGAGAG AAGAGAGTCA GTGGCACTCA TGCTGATGTT 15600 

TAAGTGCTTG ATGTTATTTC AATGTTATGG GCTGTTGCAG GTATTTCTTG GAAATGAGCT 15660 

ATTTACAGCA AGGGTGTTTG CCTCTCATTG CTGTAGTTCC CTGAGAAAAG AGCCTGTGTT 15720 

CAATGATGAG CTCCCATCCC GCATCCTGTG TGGCACTCTG TCCATCAAGC CCAGTGTGAA 15780 

GGAGTTCACG GAAACCTCAG CTGTGTTTGA GGATGGGACC ATGTTTGAGG CTATCGACTC 15840 

TGTCATCTTT GCAACAGGCT ATGATTATTC CTACCCCTTC CTTGATGAGA CCATCATGAA 15900 

AAGCAGAAAC AATGAGGTTA CCTTGTTTAA AGGCATCTTC CCCCCACTAA TGGAGAAGCC 15960 

AACCTTGGCT GTGATTGGCT TGGTTCAGTC CCTTGGAGCT GCCATCCCCA CAGCAGACCT 16020 

GCAAGCCTGG TGGGCTGCTA AAGTATTTGC AAGTAGGTGG GCCATTCTGT CTTTCATTCA 16080 

TTTTATCAAT GAACATTTAC TGAACACCTG CTATATGCAA AGCACTGTGC TAGGGATACA 1614 0 

ATGAGAACAA GACAAACATG TTCCTTGACC TCTCAAGGCT TAAAATGGGG TGTGGGGGAT 16200 

GCCATAATAG GGGAAATTTG GGGGGGTTCT AGTGAGGGGA GTTGGACTGT TGCACAGAGC 16260 

AAACAGTATA CAGGAAGTCA TAAAGGTGAG GGAAAGCATG AAATGTGTAA GGACCCAGAA 16320 

ACATTTTGGT GGAAGGGAAT ATAAAGCAGA GGCAGGGAGT GGCAAGAAAT ATAGGTTTAT 16380 

AAGCCACGTT AAAGAGCTTA AACTTCTCAT AGGGATTAAG GACTTCGCAA GATTTTAAGC 16440 

AAGAAAAAAA TAGCAGAGGA TAACTGCAAT GTCAGGCTAC ATTATAAAGA TTGGAAGGGC 16500 

CCTGGTGAGG GTTGGAGGTG TGCCAGAAAC CTCACTGGTG TCAACTTCTG TCAGAATAAC 16560 

AAAGTCAGGC CACTCTGATT CTCATGACAA TCTTCTTCTT CTCTCCCTCT ACTCTAGACC 16620 
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TCATGGTCTC CAGGGGCTAC AAGTATGCTT ATGTGAGGAA ATCAAGAATA TGAGGATTAC 16680 

ATGGAGAAAG GCAATGTCTC AAATATATTA ATTTACTCCA GTCATACTGA ATATTATCAT 16740 

TATTATTGAA AAGTGTTCTT TTATTCAGGT ATTCTCCAAA ATATTGACCA ATATAGGTAT 16800 

AACTTACCTA ACATAACTAA TCCATAAAAA CTTACACTAT TGGTAATTAA CAAACCATTA 16860 

CAATCATGGA ATATATGTAT ATATATTGTC TAAAACTTTG TAGATAAATA AATTTCTATT 16920 

TCAAATACAC CATGAAAGAT CATCATTTAA ATAAACCCCA TCATGAAATC TTTTGTAAAG 16980 

GTGCTCCCTG CAAAATACTT CTATTGCCTT TTTCCTTCGA AAGGCACAAC AATGCCAAGA 1704 0 

GCCTGGGGTA TTATGAGAAG ACTGGATATA GTTCATAAAC CTAAGAAATT TACATGAAGC 17100 

AAATGGTATC ATTTATTTAT TCAGCAAATA CTTACTGAAC ACCTACTAT6 TGTCAGGCTC 17160 

TAACCTGGCA CTTAGGACAC AACAACAAAC GAAGCAGAAC AAAATTCTGG CCTCTTACTT 17220 

TCTAGCAGGG TGTCCAGCCA ATATCAATCA TAGGGTACTA CCAGGTTGAC ATAAGACACT 17280 

AACGATGACT GGGAAATATT CATGCACTGC AAATTTTAGA GTAACTTTCT TCCACTGTTA 17340 

CAAAGGCAAA TAAGCTACCA TCACCAGTTA AAAGAAGTTG CATTGATGTA GTGAAATTCA 17400 

CAAAAAGCTA AAACTTGTCT GCTGCCCCTT AAAACACCTT GCATAGTTGC AGAAGATGTT 174 60 

TAAAATCCTA TGCTTCCTTC CATTACCTCA TTTAAAATGG CAGAAACCTT AAAGGGAACT 17520 

GTTTTACCAG ATTCTTTCTT CAGAGAAGTT TTAGGAAAAG GATACAGAAA AAAAAGGAAG 17580 

AAATTATTAA GCTATTATAT GCATGAAGTG TACTGAGCAC ATATGTTGAG GATTAGGTCC 17 640 

TCTATAATGT TACCGAAATA AGAGACTGAG TGATTTGAAG CTACAAATGT CTCTGCTGTC 17700 

ACTATCTCAC TACAGGCCAG CTTTTCCAAT TCCCAAAGGT TCATTAACTT TTCAGATCTT 17760 

TGTTTCTATG AACTGGTATT TTGCTAAAGA TATCAAAGAC ATCTCCAGCT CCTCTTAATA 17820 

CAAAAGTTTT CAGGAATACA GTTTATAAAA ACCAAATGAT TTCCATCATA TGTCATTATA 17880 

TATTTCTGAT TTGTGTTTTT CAATATTTTT CTCTTCATTT CTTTTCTAGA CTCATGTACC 17 940 

CTGCCAACCA CGAATGAAAT GATGGATGAC ACTGATGAGA AAATGGGGAA AAAACTCAAG 18000 

TGGTAAGCAG CTAACTGTAC TTGCTAATAG AGCAAGTTCC TAAAATGTGC CTTTATGTGT 18060 

AGAAAAACAT TAATATGCTT TAATATTGTC ATTAGTCAGA GTTTACATTT TCTGAACACT 18120 

TGCAATAATC AAAAAATGTT TAGATAGTAA ACAGTCATCA CACTTCTCTT GTGTAACTCA 18180 

AGAATAGAGG TTTTCTATCA GGGATAATTT TGCCCTCCAG GTGACATATG GCAAAATCTG 18240 
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GAGACACTTT TGGTCATTGT GAGTGGAGAG GGCATGCTAT CAGCATCTTA TGAGTAGAGA 18300 

ACAGGGATTC TGCTAACCAT CCAACAATGC AGAGCACAGT TCACCAAAAC AATTATCTGG 18360 

CTCAAAATGT CAATAGTGCT GAGGTTAAGA AACAACTCTA TAAATGACTA CAGTTGACCT 18420 

TTGAACAACA CAGGTTTGAA TTATATGGGT CCACTTATAC ATGGATTTTT TCAATTAACA 18480 

TAATGCAGAT TGGGCATGGT GGCTCACGCC TGTAATCCCA GCACTTTGTG AGGCTGAGGC 18540 

GGGCGGATTA CCTGAGGTCA GGAGTTCGAG ACCAGTCTGG CCAACATGGT AAAACCCTGT 18600 

CTCTACTAAA AATACAAAAA AAATTAGTCG AGTGTGGTGG TGTGCACCTG TAATCCCAGC 18660 

TACTCGGGAG GCTGAGGCAG GGGAATTGCT TGAATCAGGG AGGTGGAGGT TGCAGTGAGC 18720 

CAAGATCGCG CCACTGCACT CTAGCCTAGG TGACAGAGTG AGACTCCATC TCACAAAAAA 18780 

AAAAAAAAAA AATGCAATTT TTTGGAGATT TGCAGCAATT TAAAAACTCA AGGCCAGGCG 18840 

CGGTGGCTCA CGCCTGTAAT CCCAGCACTT CGAGAGGCCG AGGCGGGTGG ATCATGAGTT 18900 

CAGGAGATCA AGACCATCCT GGCTAACATG GTGAAACCCC GTCTCTACTA AAAATACACC 18 960 

AAAATTAGCC GGGCGTGGTG GCGGGTGCCT GTAGTCCCAG CTACTCGGGA CGCTGAGGCA 19020 

GGAGAATGGC GTGAACCCAG GAGGCGGACT TGCAGTGAGC CCAGATTGTG CCACTGCACT 19080 

CCAGTCTGGG CAACAGAGTG AGACTCCGTC TCAAAAAAAA AAAACCTCAA AGATGAATTG 19140 

TGTAGCCTAG AAATATTTTA AAAAATTAAG AAAAAGATGC CATGTATAAA ATATTTGTAG 19200 

ATACTAGTCT ATTTTATCAT TTACTACCAT AAAATATACA CAAATCTATT ATTAAAAATT 19260 

AAAATTTATC AAAACTAAAT GCATACAAAC TCTTAGACTA TACATGGCAC CATTCATAGT 19320 

CAACAGAAAT GTAAACAAAC ATAAAGATGC AATATTGTCA TAACTGCATA AAATATAGCA 19380 

CATAATGTGC TAGTATAATA ATTTTGCAGT CACCTCTTGT TGGTATTGCA GTGAGCTCAA 194 4 0 

GTGTTTTGAG TATCTACTTA AAATGCTGTG TGACATTAGT CATTTTCACC TGAGCAGTTC 19500 

ATATCTCCAG TAAATTCTGC CTCACAGTAA ^AAGTGATCT CTCAAGGTTC TCACATATTT 19560 

TTATCATGTT TAGTGCAATA CCTTAAGCCT TTAATAACAC CATGGGCTCC ATATGAAGTG 19620 

TCATTAATGA TGTTGGAAGT GCTCCCAAGA AGCAGAGAAA AGTTATGACA TTATAATAAA 19680 

AAAATTGAGT TGCTTAATGT ATACTATACA TTGAGGTCTG CAGCTATAGT TGCCCACCAT 19740 

TTCAAGATAA ATGAATCCAG TGCAACTATG CCAGCAGGCA TGAAATCTTG CACTTTTTGT 19800 

AAAATATCTT TTTATTTTGG ATTGAAAATG CAGCTTTTTA TGTGGGTGCA GGATTGCTAT 19860 
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AAGGAAGTAT ACATATAGAC TCTAATATAA TTTGAGAAAA AGTGAAGTTA TTATATGACA 19920 

AAGCAAAAGG AAGGTGAAGG ATCTAGAGCT GGAAAAGTTA ATGCCAGCAA AGGATGATTT 19980 

GATTACATCA GAAAGAGTTT GGCTTCAAAA ATGTCAAGAT AACAGGAGAC ACGCATGCTG 2004 0 

CCAACCAAGA AGAAGGAGAT GAATTCCCAG ATGTCATTAT GAAAATCATT GAGGAGAAAG 20100 

GATTTCTGCC TGAACAGATT TTTAACACAG ACAAAAGTGC CCTATTCTGG AAAAAAAAAA 20160 

AAAAAAAAAG CCACAAAGGC CATTTATTAA TAAGGAGCAG AAGTGAGCAC CAAGATTAGG 20220 

CAGGAAAGAA TAAGCTAACT ACTGTTTTGT GCAAATGCAG TCAGATTTAT GATCAGGATG 20280 

GCCCCTACCT ATGAAGCTAC CCCCTCAAAC CTTGAAGGGA AAAGATGAAT ATCAGCTTCC 2034 0 

TATCTTTTGG TTATACAAGA CCCTTTTTCT GGATTAGCTC TGTCAATGCT TTGTCCCTGA 20400 

AGTCAGAAAG TCCTTGCCAA TAAGAGACTG CCTTTTAAAG TTTTTTTGAT ATAGACAATG 204 60 

CCCCTGACCA CCCAGAACCC CATGAGTTCA ACATGGAAGG CATCGAAGTA GTCTAATTTC 20520 

CCCCAAACAC AACATTCTAA TTCAGCCTTT ATATCAGGGA GTCATAAGGA CCTTTAAGGC 20580 

TCATCACATA CCATACTCTA TGGAAAAGAT AGTCAATGCT GTGGAAGATA ACCCAACAGA 20640 

GAGAACATCA TGAAAGTCTG GAAGGATTAT ACCATTGAAG ATGCCCTAAT TGTTATAGAA 20700 

AAAGCCATGA AAGCCATCAA TCCTAAAACA ACATATTTCT CCTGGAGAAA ACTATGTCCA "20760 

GATGTTATAT ATGACTTCAG AGGATTTACA ACAGACCAGT CACAGAAATC ATGAAAAAGA 20820 

TTATGGATAT GGCAAAATAA AAAGGTGAGG GTGAAGGGTT TCAAGATATG GATCATGGAG 20880 

AAATTCAACA GCTAATAGAC ACCACTAATA GACACTTTTA ATTCCACACT AGAGGAACTA 2094 0 

AAAGATGACT TGATGGAGAT GAGTCCTTCC AAAGCAGTGC CAGATGAGAA CGAAGACATA 21000 

GAAAAAGCCA TGCCAGAAAT AAATTGACAT TAGATCATCT GGCAGACAGG TTCCAGTTAT 21060 

TTAAGACTTC TTTTGACTTC TTTTATATAA CATGGACCCT TCTATGATAC AGGCACTGAA 21120 

ACTAAAGCAA ATGATAGAGG AAGGATTACT ^CTATATAGA AAATTTTTAG AGAAATAAAA 21180 

AAGCAAAGTC AGACAGAAAT TATAATATAT TTCCATAATT ACACCAATGG GCCTGCCTCT 2124 0 

CCTGCCCCCA ATTCTACCTC CTCCATCTCT TCCGCTTCTG CCAGGCCTGA AACAGCAAGA 21300 

CCAACCCCTT CTGTTTCTCC TCCTACTCCT CAGCCTACTC AACATAAAGA TGATAAGGAT 21360 

GAAGACATTT ATGATAAACC ACTTCCACTT AATGAATAGT AAACATATTT TTTCTTCCTC 21420 

ATAATTTTCT TAATAACATT TTCTTTTCTC CATATTACTT TATTGTAAGA ATAGTATTTA 214 80 
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ATACGTATGA CATATAAAAT ATGTGTTAAT CAACTGTTTG CATTATTGGT AAGGCTTCCA 21540 

GTCAACAGGT TATTAAGAGT TAAGTATTTG GGGAGTCAAA AGTTATACAT GGATTTTTGA 21600 

CTGCAAGAGG GCTCAATGCC CCTAACCCCT CAGTTCTTCC AAAGTCAACT GATATAGGAA 21660 

GTTTCTTTAC TTTTTCAAGC ATTTAACATT GCATTGATAT GTCAACCTAA AGGAAAACAC 21720 

TGAGGCAAAT TTAATATAAA AAGAGAATTG ATTTGGGCCA AGTTTGAGGA CTGCAACCCA 21780 

GGAGCACAGA GTCAAATTGC CCTGAATATG CACTCCGTTG GCAGCAGTTA CAAGTAGGTT 218 40 

TTTTAAAGGA AATACAAAAG AGTCAACTTC TAAGTTGTTT ACCAAGAACT TACATTAAAA 21900 

TTATATAAGC TATTGATTGG CTATATACTG TTCTTCGTAT CACAAATTCT ACGAACATGA 21960 

AGATGATGAG TGAGACAGCT AGTCAGGAAT AAAAATGCCT TTTAACAATT GCCGCCAGGC 22020 

TTGGTAGAGG GCAGCATGAC AAGTCCCATA CACGTGGCTC TCTCAGCTTG ATAAATTTTG 22080 

CATACCTCAC ATAGTGCAAA CTACTCTGAG CTATTTTTCT TCTCTCACAT TGAATGCCAC 22140 

AATGTAGTCA CCCATTCAGG GCCTAGAGAA GAAAAGAAAT GGAACCCTCA GATTCAACAA 22200 

AACCTCTCCT GCACAACTTC AGCCAGTTGA CGAACAACTT GCAGAGTTGG GCACTTTTAT 22260 

GTGCTAACAA TTCATGCAGC TTGATACCCT TTCCTTTAGA GCCCAGTAGA AATAAAAATG 22320 

AGGAAATAGA GAGGTTAAAA TGTTCATCTT ATTGCTTAAA TGATAAGCTG CTCTTCAGAG 22380 

TTTCAAAAAG CAAATTACAC CATATTCCAA CTAAAAGAAC TATAGAGGCG GAAAGGAGGT 224 40 

GATCTCTTTT CTCTCTGTCA TAAAAGGTAA TGGCCAACAC CCCTATAACA AAAGACAGGT 22500 

TAACAAGAGA AAACGTGACA GATTTATTAC GTGCACATGT GTGCATGAGA GCCTTACAAA 22560 

ACATGAACTC AAAGGAGGGC CAGATCATTC ATGTTTAAAT ATTCTCTTCA CTGGGGTTAG 22620 

GGGAGATGGA AGTGTAAAAG TAAATGATTT TTCAGAGGAA ATTAATAAGT CCAAAGAACA 22680 

CAGATTAGAC CAAGTTTCTC TGGGCTTTGG GGGAGGTGTA ATCACCCAAC AGATTCATCT 22740 

TGCTCACTGC CCAGAAAAGC TGATGCCCTG ^GAACAGCAG GTTTTTCCAA TAGAGAGAGT 22800 

TTAATAAACA CACAGCTGTC AGAGGCATTT GAACCAGAGT GACTCCATCT TGAATAGGGG 22860 

CTGGGTAAAA TGAGGCTGAG ACCCACTAGG CTGCATTCCC AGGAGGTTAG GCATTCTTAG 22920 

TCACAGGATG AGAAAAGAGG CCAGCACAAG ATTCAGGTCA CAAAGACCTG GCTGATAAAA 22980 

CAGGATTCAG TAACGAAGCT GGCCAAAACC CACCAAAACC AAGATGATGA AAAAAGTGAC 23040 

CTCTGGTCGT CCTCACTACT CATTATATGC TGATTATAAT GAATTAGCAT GCTAGAAGAC 23100 
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ACTCCCACCA GCACTGTGAT AGTTTACAAA TGCCATGGCA ATATCAGGAA GTTACCCTAT 23160 

ATAGTCTAAA AAGGGGAGGA ACCCTCAGTT CTGGGAACTG CCCATTTCTT TCCTGTAAAA 23220 

CTTATGAATA ATCCACCCCT TGTTTAACAT GTAATCAAGA AGTAACTATA AGTATACTCA 23280 

GTTGAGCAGC CCATGCCACT GCTCTGCCTA TGAAGTAGCC ATTCTTTTAT TCCTTTACTT 23340 

TCTTAATAAA CTCGCTTTCA CTTTATGGAC TGGCCCTGAA TTCTTTCTTG TGAGAGGTCC 234 00 

AAGAACCCTC TTTTGGGGTC TGGCCAGCTA AACGGAAGGA CAGGAGTTTA TTACTACTCA 234 60 

AATCAGCCTC CATGAAAATT CAGAGGCTAG ATTTTTTTAA GGATAGTTTG GTAGTCAGGG 23520 

GCTAGGGAAT GGGGAATGCT GATTGGTTGG GTCAGGGATG AAACCATAGG GAGTCAAAGC 23580 

TTGTCTTCTG GTCTTCCTGG GAGGAGACCA CATGACAAGA TGAACCAGTT TACCAGTCTG 2364 0 

GGTAGTGCCA GCCGGCCCAT CAGAATGCAG GGTCTGAAAA ATATCTTGAG CACCAATGGT 23700 

AGGTTTTATA ATGGTGATGT TATCCATAGG AGCAATTGGG GACTTCTGAC TGCATGACTC 23760 

CTGAGCCCTA ATTTCTTATC TTGTGGCTAA TTTGTTAGTT CTACAAAAGC AGTCTGATCT 23820 

CCAAGCAAGG AGGGGGTTTG TTTTGGGAAA GGGCTGTTAC CATCTTTGTT TCAAAGTTAA 23880 

ACTGTAAACT AAATGTCTCC CATAGTTAGC TTGGCCTATG CTCAGGAATG AATAATGGCA 23940 

GCTTGGAGAT TAGAAGAAAG ATGGAGTAAT TACATTTTTT TTTCACATTT TTTTCACTGT 24 000 

CACAATTTTT TTAAAGGTGA TTTCAGAGGT AACATCACAG GACATGGGAG ACTAAAGGGA 24060 

GGAAAGTATG TCAAACAAAG GCTGTCCTGT TCTGCAGACG AAACCTCACA GAAAGCAACT 24120 

CTCAGAGTCA GTAGCCTATG ATGAAAGTTT CTCTGTCAGA CATTCAGCAG TGCCTGACTC 24180 

TCAGTCTCTC TCTCCTGCAA GTTAATCTTT CCTAGAGTGG GCAAGGGAGG CCTCCGAGAA 2424 0 

AGCCTAGTTT CCATCTTCTG TTTACTTCCT TTTATTTTCT CCACAGATAA AAATCTCCTT 24 300 

CACAAAAGGC AGCTTTTCAG GGCTGTTTCT GTCTGCAGGC CCTCTGAATA GCCATCTCAA 24 360 

AATCTGTCAA CGAAGTGTAT ATTTTGCAGT AAAATATTTT TTGTTTTCTT TAGTATGAAA 24 420 

CAATTTATAT TATTAGATTA CAGGAGTATT AAAACCATCC ATGATCTCAC TTTTAAACAA 244 80 

ACCAATCTGA AAGTCTAACA TTGGGGCAGA TTCTAAGCAA TGTCTTATAA AGAATAATTA 24 540 

TGTGTTAATG AGTAAACTAA GTTAATTAGT CTCCTTAAAC CAGAGGGTCA GTTTACTCCA 24 600 

GGCCACATGG TCAAAGGCAA AAGTCCAACA TTACATCAAA CTCAAATAGA GATTAGGAAG 24 660 

GAGGAGAAAA GCAGCTCACT TAGCTAAAGA AAAAACAATA AATTCAATTT TGTGGAAAAG 24720 
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GAGGGCATAA ATGGAGGTGC TATCTAAAAT GTTATTTTTC TGAAAGAAAA AATAAGAAAT 24780 

TAATGCTCCT ATTTGCAACT GTAACACTTA TTCCAGTATG TTCTCTTCTT TCTTCATGTT 248 40 

TGGCCAGAGC CAGACTTTGC AGACAGATTA CATCACATAT GTGGATGAGC TGGGCTCTTT 24 900 

CATAGGGGCC AAGCCTAACA TACCATGGCT CTTCCTGACA GATCCCCGCC TGGCCCTGGA 24 960 

GGTGTACTTT GGCCCTTGCA GCCCATACCA GTTTCGACTG ATGGGACCAG GGAAGTGGGA 25020 

TGGGGCCAGA AATGCCATCC TGACCCAGTG GAACCGGACA GTGAAGCCAA CCAGGACAAG 25080 

AGTTGTCAGT GAAGTTCAGC GACCCCATCC CTTTTACAAT TTGCTTAAAA TGCTTTCATT 2514 0 

CCCATTACTC CTTCTGGCTG TTACACTTAC ATTTTATTAA TGAGAAAGTC TTTGAGGTCT 25200 

CAAAATTCAG CATAGAAGTG TAATCACACA ATACAACACA CACCACACAT ACACACACAC 25260 

AATCACAACA TAGTTCCTCT CTCCTTTCCT GAAGATATGA AAATCAGTCT TGGCCCATTT 25320 

GAATTAAAGT ATAAGTAAAA TGGAAAATAC TCAGCCTCTC TCTCTCTGTT GGGAATCTGT 25380 

TCTCTAAAAG GCTTTTCACA TGCTGAATTG GCAAATTTGG GGATGCTTAA GATAAGACAG 254 40 

GAAGTTGAAT AAGCATGAGC ACAG 254 64 
(2) INFORMATIONS POUR LA SEQ ID NO: 5: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1605 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin§aire 

(ii) TYPE DE MOLECULE: ADNc 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 5: 

GCAATCATGA GCAAGAGGGT TGGCATCATC GGAGCTGGAG TCAGTGGCTT GGCTGCCATA 60 

TGGTGCTGTC TGGAGGAGGG GCTGGAGCCC ACTTGCTTTG AAAGGAGCGA TGATGTTGGA 120 

GGCCTGTGGA AATTCTCAGA CCACACAGAA GAAGGCAGAG CCAGCATTTA CCAGTCTGTA 180 

TTCACAAACT CTTCCAAAGA AATGATGTGC TTTCCAGACT TCCCTTATCC GGATGATTAC 24 0 

CCAAACTATA TACACCACAG CAAGCTCCAG GAATATATAA AGACATATGC TCAAAAGAAG 300 

GAACTTTTAA GATACATANA GTTTGAGACC CTGGTTTCCG GTATAAAGAA ATGTCCCAGC 360 

TTCTTAGTCA CGGGCCAATG GGTTGTTGTT ACTGAAAAGG ATGGGAAACA GGAATCTACT 420 

ATTTTTGATG CTGTAATGAT TTGTTCAGGA CATCACGTAT ACCCCAATCT GCCAACGGAT 4 80 
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TCCTTTCCTG GCCTGGACCA GTTTCGAGGC AACTACCTCC ATAGCCGGGA TTATAAGAAT 540 

CCAGAAGCCT TCAAGGGGAA GAGGGTCCTC GTGATTGGTC TGGGGAATTC GGGATCTGAC 600 

ATTGCTGTTG AGCTCAGCCG TCTGGCTACA CAGGTCATTA TCAGTACCAG AAGTGCTTCC 660 

TGGGTCATGA GTCGGGTCTG GGATGATGGC TATCCTTGGG ATATGATGTA TGTTACCCGC 720 

TTTGCATCCT TTCTCCGGAA TGTCCTTCCT TCATTCATCT CTGACTGGTT ATATGTCCAG 780 

AAGATGAACA CGTGGTTTAA GCATGAGAAC TATGGCCTGA TGCCTTTAAA TGGTTCCCTG 840 

AGAAAAGAGC CTGTGTTCAA TGATGAGCTC CCATCCCGCA TCCTGTGTGG CACTCTGTCC 900 

ATCAAGCCCA GTGTGAAGGA GTTCACGGAA ACCTCAGCTG TGTTTGAGGA TGGGACCATG 960 

TTTGAGGCTA TCGACTCTGT CATCTTTGCA ACAGGCTATG ATTATTCCTA CCCCTTCCTT 1020 

GATGAGACCA TCATGAAAAG CAGAAACAAT GAGGTTACCT TGTTTAAAGG CATCTTCCCC 1080 

CCACTAATGG AGAAGCCAAC CTTGGCTGTG ATTGGCTTGG TTCAGTCCCT TGGAGCTGCC 1140 

ATCCCCACAG CAGACCTGCA AGCCTGGTGG GCTGCTAAAG TATTTGCAAA CTCATGTACC 1200 

CTGCCAACCA CGAATGAAAT GATGGATGAC ACTGATGAGA AAATGGGGAA AAAACTCAAG 1260 

TGGTTTGGCC AGAGCCAGAC TTTGCAGACA GATTACATCA CATATGTGGA TGAGCTGGGC 1320 

TCTTTCATAG GGGCCAAGCC TAACATACCA TGGCTCTTCC TGACAGATCC CCGCCTGGCC 1380 

CTGGAGGTGT ACTTTGGCCC TTGCAGCCCA TACCAGTTTC GACTGATGGG ACCAGGGAAG 1440 

TGGGATGGGG CCAGAAATGC CATCCTGACC CAGTGGAACC GGACAGTGAA GCCAACCAGG 1500 

ACAAGAGTTG TCAGTGAAGT TCAGCGACCC CATCCCTTTT ACAATTTGCT TAAAATGCTT 1560 

TCATTCCCAT TACTCCTTCT GGCTGTTACA CTTACATTTT ATTAA 1605 

(2) INFORMATIONS POUR LA SEQ ID NO: 6: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 532 acides amines 

(B) TYPE: acide amine 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: peptide 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 6: 

Met Ser Lys Arg Val Giy lie lie Gly Ala Gly Val Ser Gly Leu Ala 
15 10 15 

Ala lie Trp Cys Cys Leu Glu Glu Gly Leu Glu Pro Thr Cys Phe Glu 
20 25 30 

Arg Ser Asp Asp Val Gly Gly Leu Trp Lys Phe Ser Asp His Thr Glu 
35 40 45 

Glu Gly Arg Ala Ser He Tyr Gin Ser Val Phe Thr Asn Ser Ser Lys 
50 55 60 

Glu Met Met Cys Phe Pro Asp Phe Pro Tyr Pro Asp Asp Tyr Pro Asn 
65 70 75 80 

Tyr He His His Ser Lys Leu Gin Glu Tyr He Lys Thr Tyr Ala Gin 
85 90 95 

Lys Lys Glu Leu Leu Arg Tyr He Gin Phe Glu Thr Leu Val Ser Gly 
100 105 110 

He Lys Lys Cys Pro Ser Phe Leu Val Thr Gly Gin Trp Val Val Val 
115 120 125 

Thr Glu Lys Asp Gly Lys Gin Glu Ser Thr He Phe Asp Ala Val Met 
130 135 140 

He Cys Ser Gly His His Val Tyr Pro Asn Leu Pro Thr Asp Ser Phe 
145 150 155 160 

Pro Gly Leu Asp Gin Phe Arg Gly Asn Tyr Leu His Ser Arg Asp Tyr 
165 170 175 

Lys Asn Pro Glu Ala Phe Lys Gly Lys Arg Val Leu Val He Gly Leu 
ISO 185 190 

Gly Asn Ser Gly Ser Asp He Ala Val Glu Leu Ser Arg Leu Ala Thr 
195 200 205 

Gin Val He He Ser Thr Arg Ser Ala Ser Trp Val Met Ser Arg Val 
210 215 220 

Trp Asp Asp Gly Tyr Pro Trp Asp Met Met Tyr Val Thr Arg Phe Ala 
225 230 235 240 

Ser Phe Leu Arg Asn Val Leu Pro Ser Phe He Ser Asp Trp Leu Tyr 
245 250 255 

Val Gin Lys Met Asn Thr Trp Phe Lys His Glu Asn Tyr Gly Leu Met 
260 265 270 
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Pro Leu 



Pro Ser 
290 



Asn Gly Ser 
275 

Arg lie Leu 



Leu Arg Lys 
280 

Cys Gly Thr 
295 



Glu Pro Val 



Leu Ser lie 



Phe Asn 
285 

Lys Pro 
300 



Asp Glu Leu 
Ser Val Lys 



Glu Phe 
305 

Ala lie 



Thr Glu Thr 



Asp Ser Val 
325 



Ser Ala Val 
310 

He Phe Ala 



Phe Glu Asp 
315 

Thr Gly Tyr 
330 



Gly Thr 
Asp Tyr 



Met Phe Glu 
320 

Ser Tyr Pro 
335 



Phe Leu 



Asp Glu Thr 
340 



He Met Lys 



Ser Arg Asn 
345 



Asn Glu 



Val Thr Leu 
350 



Phe Lys 



He Gly 
370 



Gly He Phe 
355 

Leu Val Gin 



Pro Pro Leu 
360 

Ser Leu Gly 
375 



Met Glu Lys 
Ala Ala He 



Pro Thr 
365 

Pro Thr 
380 



Leu Ala Val 



Ala Asp Leu 



Gin Ala 
385 

Thr Thr 



Leu Lys 
Tyr Val 



Trp Trp Ala 



Asn Glu Met 
405 

Trp Phe Gly 
420 

Asp Glu Leu 
435 



Ala Lys Val 
390 

Met Asp Asp 



Gin Ser Gin 



Gly Ser Phe 
440 



Phe Ala Asn 
395 

Thr Asp Glu 
410 

Thr Leu Gin 
425 

He Gly Ala 



Ser Cys 
Lys Met 
Thr Asp 



Lys Pro 
445 



Thr Leu Pro 
400 

Gly Lys Lys 
415 

Tyr He Thr 
430 

Asn He Pro 



Trp Leu 
450 



Phe Leu Thr 



Asp Pro Arg 
455 



Leu Ala Leu 



Glu Val 
460 



Tyr Phe Gly 



Pro Cys 
4 65 

Gly Ala 
Thr Arg 



Ser Pro Tyr 



Arg Asn Ala 
485 

Thr Arg Val 
500 



Gin Phe Arg 
470 

He Leu Thr 



Val Ser Glu 



Leu Met Gly 
475 

Gin Trp Asn 
490 

Val Gin Arg 
505 



Pro Gly 
Arg Thr 
Pro His 



Lys Trp Asp 
480 

Val Lys Pro 
4 95 

Pro Phe Tyr 
510 



Asn Leu 



Leu Lys Met 
515 



Leu Ser Phe 
520 



Pro Leu Leu 



Leu Leu 
525 



Ala Val Thr 



Leu Thr Phe Tyr 
530 
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(2) INFORMATIONS POUR LA SEQ ID NO: 7: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 

(C) KOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucl6ique 

(A) DESCRIPTION: /desc « "oligonucleotide" 



(xi) DESCRIPTION DE LA SEQUENCE; SEQ ID NO: 7: 
TCACATAGAG TGCTATGGGG G 

(2) INFORMATIONS POUR LA SEQ ID NO: 8: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 25 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc = "oligonucleotide" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 8: 
CTTAGGAAGA AGATAAAAAT GCAAC 
(2) INFORMATIONS POUR LA SEQ ID NO: 9: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 23 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION; /desc = "oligonucleotide" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 9: 
AATGTCCATC ATCATAGTTC TCT 
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(2) INFORMATIONS POUR LA SEQ ID NO: 10: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 23 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucl^ique 

(A) DESCRIPTION: /desc = "oligonucleotide 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 10: 
TAGGCTTGTG TAGCCTGCCC TCA 
(2) INFORMATIONS POUR LA SEQ ID NO: 11: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 16 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucl^ique 

(A) DESCRIPTION: /desc = "oligonucleotide 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 11: 
CCTCAGAGAG AACTAT 

(2) INFORMATIONS POUR LA SEQ ID NO: 12: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 16 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucl^ique 

(A) DESCRIPTION: /desc = "oligonucleotide 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 12: 



GGAGTCTCTC TTGATA 
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(2) INFORMATIONS POUR LA SEQ ID NO: 13: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 16 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc = "oligonucleotide" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 13: 
CCTCAAAGAG AACTAT 

(2) INFORMATIONS POUR LA SEQ ID NO: 14: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 16 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: Autre acide nucleique 

(A) DESCRIPTION: /desc = "oligonucleotide" 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 14: 
GGAGTTTCTC TTGATA 
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REVENDICATIONS 

1. Sequence nucleotidique isolee, caracterisee en 
ce qu*elle est choisie parmi : 

5 a) les sequences codant pour la proteine FM02 ou FMOx 
humaine et leurs variants proteiques, 

b) les sequences codant pour un fragment de I'une de ces 
proteines ayant au moins 10 bases, 

c) les sequences genomiques FM02 ou FMOx humaines et leurs 
10 alleles, 

d) les sequences presentant au moins 80 % d'homologie avec 
les sequences (a) et (c) , 

e) les fragments des sequences (c) ou (d) ayant au moins 10 
bases, 

15 f) les sequences qui s'hybrident avec une sequence de (a) a 
(e) . 

2 . Sequence nucleotidique caracterisee en ce 
qu'elle est choisie parmi : 

20 a) les sequences codant pour un polypeptide comprenant les 
amino-acides selon la sequence SEQ ID N*» 3, ou selon la 
sequence SEQ ID N*=* 6, 

b) les sequences nucleiques SEQ ID 1, SEQ ID N*' 2, ou 
les sequences nucleotidiques representees Figures 2 et 1, 

25 les sequences nucleotidiques SEQ ID N° 4, SEQ ID 5, ou 
les sequences nucleotidiques representees Figure 10, ou les 
sequences nucleotidiques codant pour les polypeptides 
correspondants , 

c) un fragment d'une sequence selon (a) ou (b) comportant 
30 au moins 10 bases, 

d) une sequence qui comporte par rapport aux sequences (a) , 
(b) ou (c) au moins une mutation ponctuelle, et 

e) une sequence complementaire des sequences (a) , (b) , (c) 
ou (d) . 
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3. Sequence nucleotidique selon I'une des 

revendi cat ions 1 ou 2, caract^risee en ce qu»elle comprend 
au moins la mutation G. 1263mac.A. 

5 4. Sequence nucleotidique selon I'une des 

revendications 1^3, caracterisee en ce qu'elle comporte 
au moins 10 bases. 

5- Sequence nucleotidique utilisable notamment 

10 comme amorce specif ique d*un allele caracterise en ce que 
sa sequence est choisie parmi les sequences selon la 
revendication 4 . 

6. Sequence nucleotidique utilisable notamment 

15 comme amorce nuclSique caracterisee en ce que sa sequence 
est choisie parmi les sequences selon la revendication 4 et 
les sequences SEQ ID N° 7, SEQ ID N** 8, SEQ ID N° 9 et SEQ 
ID N° 10. 

20 7. Sequence nucleotidique utilisable notamment 

comme sonde specif ique d*un allele caracterisee en ce que 
sa sequence est choisie parmi les sequences selon la 
revendication 4 et les sequences SEQ ID N** 11, SEQ ID 
12, SEQ ID NO 13 et SEQ ID N° 14 . 

25 

8. Sequence nucleotidique selon la revendication 1, 

caracterisee en ce .que la sequence code pour I'un des 
domaines de FMO. 

30 9. Polypeptide codg par une sequence nucleotidique 

selon I'une des revendications 1 a 4, et 8, notamment les 
polypeptides de sequence SEQ ID N° 3 ou SEQ ID 6. 

10, Vecteur de clonage et/ou d* expression dans une 

35 cellule hote appropriee d'une sequence nucleotidique. 



wo 98/24914 PCT/FR97/02226 

94 



caracterise en ce qu*il comports une sequence selon I'une 
des revendications 1 a 3 et 8 . 

11. Vecteur selon la revendication 10, caracterise 
5 en ce qu'il comporte les elements permettant 1* expression 

et/ou la secretion desdites sequences dans ladite cellule 
hote . 

12. Vecteur selon I'une des revendications 10 et 11, 
10 caracterise en ce qu'il s'agit d'un vecteur a replication 

autonome . 

13. Vecteur selon I'une des revendications 10 et 11, 
caracterisg en ce qu'il s'agit d'un vecteur d ' integration 

15 chromosomique . 

14. Vecteur selon I'une des revendications 10 a 13, 
caracterise en ce qu'il s'agit d'un vecteur viral. 

20 15. Vecteur selon la revendication 14, caracterise 

en ce que le vecteur est realise sur la base d*un 
adenovirus, d'un AAV, d'un retrovirus, d'un poxvirus ou 
d'un virus herpetique. 

25 16. Cellule transformee par un vecteur selon I'une 

des revendications 10 a 15. 

17. Cellule selon la revendication 16, caracterisee 

en ce qu'il s'agit d'une cellule procaryote. 



30 



18. Cellule selon la revendication 16, caracterisee 

en ce qu'il s'agit d'une cellule eucaryote. 



19. Animal, caracterise en ce qu'il contient une 

35 cellule selon I'une des revendications 16 a 18. 
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20. , Precede de production de polypeptide 
recombinant, caracterise en ce qu*on cultive une cellule 
selon l*une des revendications 16 a 18 et en ce que l*on 
r^cupere la proteins produite. 

5 

21. Polypeptide susceptible d'Stre obtenu par la 
mise en oeuvre du precede selon la revendication 20, 

22. Polypeptide specif ique de la forme mutee d'un 
10 polypeptide selon la revendication 21, caracterise en ce 

que sa sequence est choisie parmi les sequences 
polypeptidiques comprenant au moins une mutation. 

23 . Anticorps diriges centre un polypeptide selon 
15 I'une des revendications 9, 21 et 22. 

24 . Anticorps polyclonaux ou monoclonaux selon la 
revendication 23, caracterises en ce qu*ils sont obtenus 
par reaction immunologique d'un organisme humain ou animal 

20 avec un agent immunogene constitue par un polypeptide selon 
I'une des revendications 9, 21 et 22. 

25. Anticorps polyclonaux ou monoclonaux selon la 
revendication 24, caracterises en ce qu*ils sont obtenus 

25 par reaction immunologique d'un organisme humain ou animal 
k un agent immunogene constitue par un polypeptide selon la 
revendication 22. 

26. Anticorps selon I'une des revendications 23 a 
30 25, caracterise en ce qu'il s'agit d'un anticorps marque, 

notamment pour 1 * imager ie . 

27. Utilisation de cellules selon I'une des 
revendications 16 a 18 ou d'un animal selon la 

35 revendication 19, pour la selection de produits impliques 
directement ou indirectement dans I'activite FMO. 
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28. . Utilisation de cellules selon I'une des 
revendications 16 a 18 ou d'un animal selon la 
revendication 19, pour la selection de produits 
interagissant avec la FMO naturelle ou mutee, notamment a 

5 titre d'agoniste ou d' antagoniste de cette enzyme. 

29, Produit obtenu par la mise en oeuvre de I'une 
des revendications 27 ou 28. 

10 30. Methode de diagnostic d'une predisposition a des 

troubles lies a FMO chez un patient, caracterisee en ce 
qu'on determine a partir d*un prelevement biologique dudit 
patient la presence d'une mutation dans le gdne FMO par 
1' analyse de tout ou partie d'une sequence nucleique 

15 correspondant audit gene, la presence d*au moins une telle 
mutation etant indicative d'une predisposition dudit 
patient a des troubles lies ^ FMO. 

31. Methode de diagnostic selon la revendication 30, 
20 caracterisee en ce que la mutation que I'on cherche a 

determiner est la mutation G.1263mac.A. 

32. Methode selon I'une des revendications 30 ou 31, 
dans laquelle la sequence d'acide nucleique analysee est un 

25 ADN genomique, un ADNc ou un ARNm. 

33. Methode selon I'une des revendications 30 a 32, 
caracterisee en ce que ladite analyse est realisee par 
hybridation. 

30 

34. Methode selon I'une des revendications 30 a 33, 
caracterisee en ce que la presence d'une mutation est 
detectee par comparaison avec la sequence correspondante 
naturelle non mutee. 

35 
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35. . Methode selon l*une des revendications 33 et 34, 
caracterisee en ce que ladite hybridation est realisee ^ 
I'aide d'au moins une sonde oligonucleotidique specif ique 
de 1' allele. 

5 

36, Methode selon I'une des revendications 30 a 35, 
caracterisee en ce que ladite analyse est realisee par 
sequencpage , 

10 37. Methode selon I'une des revendications 3 0 a 35, 

caracterisee en ce que ladite analyse est realisee par 
migration electrophoretique, et plus particulierement par 
SSCP ou DGGE. 

15 38. Methode selon I'une des revendications 30 a 35, 

caracterisee en ce que ladite analyse est realisee par une 
mSthodologie visant a detecter une troncation de la 
proteine. 

20 39. Methode selon I'une des revendications 30 a 38, 

caracterisee en ce que tout ou partie de la sequence 
nucleique du gene FMO est amplifi^e prealablement a la mise 
en evidence de la ou des mutations. 

25 40, Methode selon la revendication 39, caracterisee 

en ce que 1 * amplification est realisee par PCR ou PCR-like. 

41. Methode selon I'une des revendications 3 9 ou 40, 
caracterisee en ce que les amorces choisies pour realiser 

30 1 ' amplification sont choisies parmi les amorces definies 
selon I'une des revendications 5 ou 6 . 

42. Reactif pour detecter et/ou identifier une 
mutation du gene FMO dans un echantillon biologique, 

35 caracterise en ce qu'il comprend une sonde dite de capture 
et/ou une sonde dite de detection, I'une au moins de ces 
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sondes comportant une sequence selon I'une des 
revendications 1 a 8, ou en ce qu'il comporte un anticorps 
selon I'une des revendications 23 a 26. 

5 43. M§thode de diagnostic d*une predisposition a des 

troubles lies a FMO chez un patient, caracterisee en ce 
qu'on determine a partir d'un prelevement biologique dudit 
patient la presence d*une FMO mutee. 

10 44. Methode selon la revendication 44, caracterisee 

en ce qu*elle utilise un anticorps mono ou polyclonal selon 
l*une des revendications 23 a 26. 

45. Methode selon I'une des revendications 43 ou 44, 
15 caracterisee en ce que la detection est effectuee par un 

procedi ELISA ou RIA. 

46. Methode de diagnostic d'une predisposition a des 
troubles lies a FMO chez un patient, caracterisee en ce 

20 qu'on determine a partir d'un prelevement biologique dudit 
patient I'activite enzymaticjue d'au moins une FMO. 

47. Composition therapeutique caracterisee en ce 
qu'elle comporte a titre de principe actif au moins un 

25 compose capable de moduler I'activite FMO. 

48. Composition therapeutique selon la revendication 
47, caracterisee en ce que le principe actif est capable de 
moduler I'activite FM02 et/ou FMOx. 

30 

49. Composition therapeutique caracterisee en ce 
qu'elle comporte a titre de principe actif au moins un 
compose capable d'interagir avec FMO. 
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50. Composition therapeutique selon la revendication 49, 
caracterisee en ce que le principe actif est capable 
d*interagir avec FM02 et/ou FMOx. 

5 51. Composition therapeutique selon l*une des 

revendications 47 a 50, caracterisee en ce qu*elle presente 
une activite differente sur FMO normale et FMO 
pathologique. 

10 52. Composition therapeutique selon I'une des 

revendications 47 a 51, caracterisee en ce qu*elle comporte 
a titre de principe actif un compose a activite pro-FMO. 

53. Composition i selon la revendication 52, 
15 caracterisee en ce que le compose a activite pro-FMO est 

choisi parmi les composes suivants : 

a) une proteine ou un polypeptide selon la revendication 
29, 

b) un vecteur d' expression selon l*une des revendications 
20 10 a 15, 

c) une sequence nucleotidique selon I'une des 
revendications 1 a 4, caracterisee en ce que ladite 
sequence est une sequence sens induisant 1' expression de 
FMO. 

25 

54. Composition therapeutique selon I'une des 
revendications 47 a SJL, caracterisee en ce qu*elle comporte 
a titre de principe actif un compose a activite anti-FMO. 

30 55. Composition selon la revendication 54, 

caracterisee en ce que le principe actif est choisi parmi 
les composes suivants : 

a) un anticorps anti-FMO, selon I'une des revendications 23 
a 26, 

35 b) un vecteur d' expression selon I'une des revendications 
10 a 15, 



wo 98/24914 



100 



PCT/FR97/02226 



c) une . sequence nucleotidique selon I'une des 
revendications 1 a 4, caracterisee en ce que ladite 
sequence est une sequence antisens inhibant 1' expression de 
FMO, 

5 d) une sequence nucleotidique selon I'une des 
revendications 1 a 4, caracterisee en ce que ladite 
sequence est une sequence sens inhibant 1' expression de 
FMO. 

10 56. Composition selon la revendication 49, 

caracterisee en ce que le principe actif est une sequence 
soluble interagissant avec FMO. 

57. Utilisation d'un principe actif capable de 
15 moduler I'activite FMO, I'activite FM02 et/ou FMOx, pour 

rSaliser un medicament destine au traitement et/ou a la 
prevention de troubles lies a FMO. 

58. Utilisation d*un principe actif capable 
20 d^interagir avec FMO, avec FM02 et/ou FMOx, pour realiser 

un medicament destine au traitement et/ou a la prevention 
de troubles lies §l FMO. 

59. Utilisation d'au moins un produit selon la 
25 revendication 29, pour r§aliser un medicament destine au 

traitement et/ou a la prevention de troubles lies a FMO, a 
FM02 et/ou a FMOx. 

60. Precede de biodegradation ou de biosynthese de 
30 compose organique ou inorganique, caracterise en ce qu'il 

met en oeuvre un polypeptide selon I'une des revendications 
9, 21 et 22 ou une cellule selon I'une des revendications 
16 a 18. 



35 61. Precede d ' elaboration de compose d'interet, 

caracterise en ce qu'il utilise un polypeptide selon I'une 
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des reveadications 9, 21 et 22 ou une cellule selon I'une 
des revendications 16 a 18 . 

62. Produit susceptible d'etre obtenu par un precede 
5 selon l*une des revendications 60 et 61. 

63. Utilisation de polypeptide selon I'une des 
revendications 9, 21 et 22, ou d'une cellule selon I'une 
des revendications 16 a 18 pour la detoxification de 

10 compost x^nobiotique. 



1/53 



FM02prot 



MetAlaLysLysValAlaVallleGlyAlaGlyValSerGlyLeuIleSerLeuLysCys 
ATGGCAAAGAAGCTAGCTGTGATTGGAGCTGGGGTCAGTGCCCTAATTTCTCTCAACTCC 

CysValAspCluGlyLeuGluProThrCysPheGluArgThrGluAspIleGlyGlyVal 
TGTGTGGATGAGGGACTTGAGCCCACTTGCTTTGAGAGAACTGAAGATATTGGAGGAGTG 

TrpArgPheLysGliiAsnValGluAspClyArtjAXaSerlleTyrGlnSerValValThr 
TGGACGTTCAAAGAGAATGTCGAAGATGGCCGAGCAACTATCTATCAATCTGTCCrrACC 

AsnThrSerLysGluMetSerCysPheSerAspPheProMetProCluAspPheProAsn 
AACACCAGCAAAGAAATGTCCTGTTTCACTGACTTTCCAATCCCTGAAGATTTTCCAAAC 

PheLeuHis AsnS erLy sLeuLeuGluTyr PheArgI lePheAlaLy s Ly a PheAapLeu 
TTCCTGCATAATTCTAAACTTCTGGAATATTTCAGGATTTTTGCTAAAAAATTTGATCTG 

LeuLysTyrlleGXnPheGlnThrThrVaXLeuSerValArgLyaCysProAspPheSer 
CTAAAATATATTCAGTTCCAGACAACTCTCCTTACTCTGAGAAAATGTCCAGATTTCTCA 

SerSerClyGlnTrpLysValValThrClnSerAsnClyLysGluClnScrAlaValPhe 
TCCTCTCCCCAATGCAAGGTTGTCACTCACAGCAACGCCAACCAGCACAGTCCTGTCTTT 

AspAlaValMetValCysSerGlyHisHisIleLeuProHialleProLeuLysSerPhe 
GACGCACTTATGGTn'CCAGTGGCCACCACATTCTACCTCATATCCCACTGAAGTCATTT 

ProGlyMetGluArgPheLysGlyGlnTyrPheHisSerArgGlnTyrLysHisProAap 
CCACGTATGGAGAGGTTCAAAGGCCAATATTTCCATAGCCCCCAATACAAGCATCCACAT 

GlySerGluClyLysArglleLeuVallleGlyMetGlyAsnSerGlySerAapIlcAla 
GGATCTGAGGGAAAACGCATCCTCGTGATTGGAATGGGAAACTCGGGCTCAGATATrCCT 

ValGluLeuSerLysAsnAlaAlaGlnValPhelleSerrhrArgHisGlyThrTrpVal 
GTTGAGCTGAGTAAGAATGCTGCTCAGGTTTTTATCAGCACCAGGCATGGCACCTGGGTC 

MetSerArglleSerGluAapGlyTyrProTrpAspSerValPheHisThrArgPheArg 
ATGAGCCCTATCTCTGAACATGGCTATCCT7GGGACTCAGTCTTCCACACCCGGTTTCCT 

SerMetLeuAroAsnValLeuProArgThrAlaValLysTrpMetllcGluGlnGlnMet 
TCTATCCTCCCCAATCTACTGCCACGAACACCTCTAAAATGGATGATAGAACAACAGATG 

AsnArgTrpPheAsnHiaGluAsnTyrGlyLeuGluProGlnAsnLyaTyrlleMetl-ya 
AATCGCTGCrrCAACCATGAAAATTATGGCCTTGACCCTCAAAACAAATACATTATGAAG 



Figure 1 



FEUILLE DE REMPLACEMENT (REGLE 25) 
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FM02prot 



tcactcgttaaagtaga(»ataatatggtctcactgtItaIat^Statt^^ 



LeuLeuAlaValValValAlaPhePheCysGlnLeuGlnTrpSer* • • 
CTTCTTGCTGTTGTTGTGGCCTTTTTTTCCCAACTTCAATGGTCCTAG 1608 



900 
960 
1020 
1060 
1140 
1200 
1260 
1320 
1360 
1440 
1500 
1560 



Figure 1 (suite) 



FEUILLE DE REMPLACEMENT (REGLE 26) 
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f ragmentl . PM02 

CACAGAAGTT ATGGAACTAT ATATNTNACA CAGCNAATCC AGATGGGTTC ATACAAAAAA 
10 20 30 40 50 

AAAATTGAGT CATAGGCGAG GGAAGAGAAA ACCAGTTTGG TTGTTATTTC TCTAACTTat 
70 80 90 100 110 '"^"^l^l 

AAGGCAACTT AATGAGAGAA CTTGTTGGTT TGTTATTTCT CTAAGGTGTA AGGCAACTTA 

160 170 180 

GGTGTAA GGCAACTTAA TGAGAGAACT 
220 230 240 

CATGTGG TTTTAAGGAG TTTTCTGTTG 
280 290 300 

AGATACC AGGGCTGATA TGTATATTGT 
340 350 360 

GACTCAT CCAAGAATGG TTCAGGCGCG 
400 410 420 

\AGGGGG CCAACACCCT CTTATTCTCC 
460 470 480 

rrCTCAG CATTTTTATG CCTATCTTAA 
520 530 540 

^CCCTAG ACTCTTGCAG TTAGTGACAT 
580 590 600 

:ttatcc actaacaagt ggtcatctaa 

640 650 660 

VCTACTA TACAAAACAA CTCACTCTAT 
700 710 720 

ZTCACAT TGAGACAAAC TCAGTITTTT 
760 770 780 

rCTTTCT ACCCAAAATA GCCTTGTATG 
820 830 840 

rrCTCAT GGATTTTTCA ATATCTCCTC 
880 890 900 

:ttatgt gacatggctt taagaagttc 

940 950 960 

»GCTAAG CCAAGCTTAT TTCCACATGC 
1000 1010 1020 

GTGAAAGATG GATGGGTGGT AAGGCCTATG GTCCTGAACT AGTAAATGAA TTAACATATG 
1030 1040 1050 1060 1070 1080 

TGAAAGTATT TTTACAACTT AAAACACTTT GTAAACACAA GATACTATTA AAACATATCT 
1090 1100 1110 1120 1130 1140 

CCTTCATAGA AGGCAACTTG GCAAAGCATA TTAGAAACTT GCAACTCAAA ATATGGTCTA 
1150 1160 1170 1180 1190 1200 

AGGGTACACC TGGCATCACC TGGAAGCTTC CAAGAAACAA TTTCAGGCCC ACCTCATATC 
1210 1220 1230 1240 1250 1260 

CATTAAATCC CACCTGCATT TTGACAAGAT CTCCAAGTGT TTCATTTGCA CATTAAAGTC 
1270 1280 1290 1300 1310 1320 

TGAGGAGCTC TGTAAACTTA AAAATATGCA AACACTTTCA CTAAGCAATC CTTGTTTTTA 
1330 1340 1350 1360 1370 1380 

GGTATTTATC CTGAGAAAAT GATTAGGTTA AGTACACAGC ATTTTTATAA CAGCAAAATC 
1390 1400 1410 1420 1430 1440 



130 


140 


150 
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TTACAAAGAA AGTTCCACTA ATAGAAAATT GGCCAAGGTG CTTTACGGTT CTTCTATGGA 
1450 1460 1470 1480 1490 1500 

TACACCATTT GCCAGCCAAG GCTAACTCTA TAAAGCAAGC TGGTTCTTCT CAGCTGGTGC 
1510 1520 1530 1540 1550 1560 

TGGTACCTAG AAGATGCCTG CTCCTCAGCT GATGCATGCC ACCATGAACA CAGATGTATG 
1570 1580 1590 1600 1610 1620 

TTTAGTTGAC ACAAAAGGCC ATTAATATCC CCACATCAGT TATCCCTCGA GGATAACTAA 
1630 1640 1650 1660 1670 1680 

GCCATCTGCC TCCATCATCT TTTAAGGGTT CAGTCAGTTT AAAACTTTGC TTCTATACCT 
1690 1700 1710 1720 1730 1740 

AGGTATTTTC TTTTCTCTGT ATGTTGGTCA GGTACAATTA TTTTTAACAG GGCTTCCATC 
1750. 1760 1770 1780 1790 1800 

AATATCATAA CTACCTAGAG AAGACATTGC AAAGATAAAA TTGGAGAATT GTTAACAGGC 
1810 1820 1830 1640 1850 I860 

TGTTAACAAA ATGTGTACCC AACTGCCAAT GAAGTGGCTT GATTTTTTTC TTTTTTTAAA 
1870 1880 1890 1900 1910 1920 

ATTTTTCTTT TGTATCCTTT TATTTTATTT ACTTATTTTT TAGAGACACA GTCTCGCTCT 
1930 1940 1950 1960 1970 1980 

GTTACCCAGG CTGGCGTACA ATGGCACAAT CATAGCCCAC TGCAGTCTCG ACCTCCAGGG 
1990 2000 2010 2020 2030 2040 

CCTCAAGCAA TCCTCCCACC TCAGCCTTCC AAGTAGCTGA GACTACAAGT GCATGCTGCC 
2050 2060 2070 2080 2090 2100 

ATGCCTGACT GATTTTTTGT TTTTTGCAGA GATGAAGTCT CACTATGTTG CCCAGTCTGA 
2110 2120 2130 2140 2150 2160 

CCTTGAACTC CTAGCAATAC CCTACCCTGG CCTCCCAAAC TGCTGGGATT ACAGGCATGA 
2170 2180 2190 2200 2210 2220 

GCCACTGTGC CTGGCCTTTT TTCATTTTAA CTGAGAAATG TGTTCAGCTC TTTTGTTCCT 
2230 2240 2250 2260 2270 2280 

TAGTCATTGA TCATCACTTT TGTTATATCT GTTAGTCTTG TCA7AGAGTT GCTGCACTTA 
2290 2300 2310 2320 2330 2340 

TTACACAGAG AAGGCCTTTT ATCACGACCA ATTTATTTTA GGAAATTTCA GGGAAAACGT 
2350 2360 2370 2360 2390 2400 

TTTTCTAGAA CACCTTATTT GACATTATAA AACAACTCTT CACTCTTGCA CTCCAGACCT 
2410 2420 2430 2440 2450 2460 

CCCTTTCCAG TTTTCTTTTT CTCCATAGTG GTCATCACCA CTTGTTTTAT TTTATTGATG 
2470 2480 2490 2500 2510 2520 

GGCTGTCTGG CTCCCTCAAC TGCAAAGTAA ACTCCACAAA GGCAGAGAGT TTTCTCTCTT 
2530 2540 2550 2560 2570 2580 

TTATTCATTG CTGTACCTGC ATCACTTAGA AAGTTTCTGG CACCTAGGAA GTCTTCAGTA 
2590 2600 2610 2620 2630 2640 

AATATTTATT GAATAAGTTT ATGTAAAACG TCTCAGACTC CTTAGAGAAA CTGGTCTTTT 
2650 2660 2670 2680 2690 2700 

GGGGTTGGAG AATAAAGTTC TTTACCTCAT CAGTTAGACT CTATCTAAGG TACACGAGGG 
2710 2720 2730 2740 2750 2760 

CTTGCTAGTC TCCTAAGTTA GTCTGCTAAT AAATGTTAAC CCTAATAACT GAAATTATTA 
2770 2780 2790 2800 2810 2820 

GCAGAGGTAA TTATCCAGTT CTATATCAAG GCAAAAAGAC AGCAGTGGAT AGAAAGATCT 
2830 2840 2850 2860 2870 2880 
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TAGAAGTCCC AC7AGGTTCA TCCAAGCCAC CATACACATA GGCAGAAAAA TCAAAATAAG 
. .Z890 2900 29X0 .2920 2930 2940 

ATATGAGCCT GGACAGGGTG AGCAATCTGG GAAAAGATGA ACACAGTATG C7AGGACCCA 
2950 2960 2970 2980 2990 3000 

GAAATCATCA AGTCTATGAA AACTAAGCCA GAACACAAAT CTGAATTCCA TAAGATCAGG 
3010 3020 3030 3040 3050 3060 

AACATAATCT GTCTTGTTCA TCCAGGCATG GTAATCTCCC AGAAATACTG CT7AACTGCA 
3070 3080 3090 3X00 3110 3X20 

AGAACTGAAT ATTTGTTAGA TAATTAAACC ATCAACTAAA TGAGATTCAT GCAACCATGA 
3130 3140 3150 3160 3170 31B0 

AAAATGCTGC TATAGGTACA CAATATTGAT ATACTAGAAA CTTAAAAAAT CAAGTTGGAA 
3190 3200 3210 3220 3230 3240 

ATTAGACTAT TCCATTTCTG TTTGTGTGTA TGTATCTACA AATAGGTGGA AGGATATACC 
3250 3260 3270 3280 3290 3300 

AAAATGTCAA CAGCAGTTAC CTCTGGGTGG TGAGGAGTAA TCTTAACCTT GTTATTTATC 
33X0 3320 3330 3340 3350 3360 

CCTATATGTT CATTTGTGAA TGAATATTTA TTACATCATT ATAAAAAGCA T7TTTAAACT 
3370 3380 3390 3400 3410 3420 

ATCTGTATGT TTAAGAGTAT ATGTTGCTAC TATGTAACAC TATATGCTCT TACTCTAAAG 
3430 3440 3450 3460 3470 3480 

ACATTGCATT ACTACTGTTG ACCTCAGACC ACGCGCCTCT TGCCTAATTC TACGACTCCT 
3490 3500 35X0 3520 3530 3540 

AACTAAGTCT TTGGAGTTTC AGCTGGAAGA ATCCTGCACG AATACGGAAC TCCTCCCATT 
35S0 3560 3570 3580 3590 3600 

TCTCACAGCC ACCTCCAACT CTTAAAAACG CTTCCAACTG CCTCCCAGCA CACAACCAAG 
36X0 3620 3630 3640 3650 3660 

GGAGAAAACT ATTCTGTCAA AGAGACGGTG CCAAAACGCA AAAACAAAGG TAAGCATGAT 
3670 3680 3690 3700 37X0 3720 

CGCTGGGGAA AGAAGCTGAA AAGGAAAAGC TCAGAACTCT AGCTGGAAAT TTCGCTCACA 
3730 3740 3750 3760 3770 3780 

TCCCTAGTAT GTTACTGCAT AGTCTGGCTT TGTTCAA7CG GTCGC7T77A AATA77AAAG 
3790 3800 38X0 3820 3830 3840 

CTAGATGTAA GCAAGC77TG CAACAAAG7C CATAAGAAAC TCAGC77TTC TCAAAGGCAA 
3850 3860 3870 3880 3890 3900 

GAAGAGAGCA GGA7Trr7GA C7GGCTC77T A77CAA7ACT CCTCC77A77 AAATTACCAC 
39X0 3920 3930 3940 3950 3960 

TCCTACAATG T7TAAAGCCA AT7ACCTGAG CACATCATAA GGA7TC7C7T ACCCC7TGTC 
3970 3980 3990 4000 4010 4020 

CCAGTTAAGT AA7GTTGATT GATCAAC7CC 7TGACACGAG CTGA7GGCAA AGAAGG7AGC 
4030 4040 4050 4060 4070 4080 

TGTGATTGGA CC7GGGG7CA G7GGCC7AA7 77CTCTGAAG 7GC7C7G7CC A7GAGGGAC7 
4090 4100 41X0 4X20 4130 4X40 

TGAGCCCACT TGCTTTGAGA GAACTGAAGA TATTGGAGCA G7G7GGAGC7 TCAAAG7AAG 
4150 4X60 4X70 4X80 4X90 4200 

TGAGA7TT7C T7GGG7CTTG AACAGGTTGT GTTGTrAT77 CAGGG7GAA7 CACAC7TAC7 
4210 4220 4230 4240 4250 4260 

GATGGGTCA7 A7TGAGAAA7 77ATTAAACA AC7CTGA7CA CATTT7A77T CTA7TTATTG 
4270 4280 4290 4300 4310 4320 

ATG7GGCCAT AA7GGAAC7G AAGTCA7AGG C7GGCATC7C 7CCCCCAG7C AA7ACTAACC 
4330 4340 4350 4360 4370 4380 

CAACCCAGGT AGC7GACCCA GGCA7GTAAA AGATCTC77C TTTTGGA77C AGCAAT7GTC 
4390 4400 4410 4420 ^ 4430 4440 
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TTACAGCCCA TACTTCTCTC ATTCTTTAAT ACGCTAATAT TAGAGAACAT riTACAAAAA 
- 4450 4460 4470 4480 4490 4500 

TAGAAGTAAC AGGGATTCTT CTCAAGATAT CACTTCTGTT TCAATTATTA AACCAAATGC 
4510 4520 4530 4540 4550 4560 

TTCTTTAGAG ACCATGCTCT TATCATTACT ATTTTTCTCT GACAAATGAA GCATGTTTGT 
4570 4580 4590 4600 4610 ^20 

TTACTGAGCT TTATCAATGA CATTCTAGTA TAACTGCTGT GAAACTCTTT GTTAAATATG 
4630 4640 4650 4660 4670 4680 

TTTTATTAAA TTTATTCTAT TAATCAAACC AAAATATTGA TAATGCTATT TGTCTCTATT 
4690 4700 4710 4720 4730 4740 

AGTCCATTCT CATGCTGCTA TGAAGAAATA CTGAGACTGG GTGATTTATA AACGAAAGAG 
^^50 4760 4770 4780 4790 48OO 

GTTTAATTGA CTCCCAGTTC CACAATGCTG GGGAGGACTC AGGAAATTTA CAATCATGGC 
4810 4820 4830 4840 4850 4860 

AGTGGGAAAG AGAGGTGCTG AGCAAAGGGG GAAAAGCCCC TTATAAAACC ATCACATCTC 
• 4870 4880 4890 4900 4910 4920 

ATTAGAACCC ACTCACTATC ATGAGAACAG CATGAGGGTA GCTGCCCCCT TGATTCAATT 
4930 4940 4950 4960 4970 498O 

ACCTACCCCC ACCAGGTCCT TCCCAAGACA TGTGGGGATT CTGGGAACTA CAATTCAATA 
4990 5000 5010 5020 5030 5040 

TGAGATTTGG ATGGGGACAC AAAGCTAAAC CATGTCACTG TCCTTAAAAA TTTGTATAAA 
5050 5060 5070 5080 5090 SIOO 

ACTTAGAAAG TTGCATAGAT ACCTATAAGG AGTTACAATT ATTCCTTCCC ACAACCTCTC 
5110 5120 5130 5140 5150 5160 

AATAGGTAGT AGCTTACCAC CTTCTAGCTG TGAGATCTTG AGCAAGTTAT TTACATCCTG 
5170 5180 5190 5200 5210 5220 

TGTTTCAATT TACTCAGTTA TAAATGGATA TAATAACAGG AAAGTGTGAT TATCTCATAG 
5230 5240 5250 5260 5270 5280 

TGCTATTTTG AAGATTAAGG GAGATAATTC ATATAAACAA CTTAGATAAG TTCCCGACTC 
5290 5300 5310 5320 5330 5340 

ATAGAGTTCA ATAAATGTTA GCTACTAATA ATAACTATAT ATTTTATAGA TGAGCAAACT 
5350 5360 5370 5380 5390 5400 

GAAAGTCAGC GACGTTAAGT GAGATGGCCA GGGCCACACA ACTGGAGGAA CTCGCCTTCA 
5410 5420 5430 5440 5450 5460 

AACCACCGCC TACGTGACTT CTAAACAGAT AAGCCCTGAC TTACAACCAT GCCCTAACTT 
5470 5480 5490 5500 5510 5520 

CCATTCTTGC TCAAAAAGAT TAAACAAAAG TTTAACTTCA GAACCCAAAA GCAATGACTT 
5530 5540 5550 5560 5570 5580 

TAGAATTATG TAATCAGGTA TCCCTGAGAT ATTAAAACAC ATAAGAATAT TCCAAATCGC 
5590 5600 5610 5620 5630 5640 

AGCAAAAGGT TTGAATACAT GAAAATCAAA CTCATATCAG CAGAGACCAT ATAAAGGGCT 
5650 5660 5670 5680 5690 5700 

CTCACTGCAC GCTGACTAGT TAGGAGGATG GCAAGGTGAT CCAGGACCTC CCCATCCTTT 
5710 5720 5730 5740 5750 5760 

GTCAGTTCAA ATTGAATCTC ATGCCAACAG CGATCTTTTT TAACATGTAA CATTAGGTGT 
5770 5780 5790 5800 5810 5820 

CTCAGGTACA CATGACCATA AACCACACCT GGAGGGTTTC TTTTATTTTC TTTTTAATAT 
5830 5840 5850 5860 5870 5880 

TTTTCTGAGA CAGGGTCCTA CTCTGTCACC CAGGCTACCA TGCCCAGCCA TGGAGAGTTT 
5890 5900 5910 5920 5930 5940 

CTTAAAGATA CTGATTCCTT TGGTTAAACC TGCCACCAAN AAAAAAA 
5950 5960 5970 5980 

Figure 2 (suite) 
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ACAAAGACTG GCATTAAATA GGTAGAGACC TAGGATGCTA ATATCTTGCA ATGTGCCAAA 
10 20 30 40 50 60 

ATAATTGTCC CTGTCCCCAA CCTCACCATT GCCAATATTA CCCCTACCCC TCACAGTGAG 
70 80 90 100 110 120 

CGTCACAGGC AGGCAACAAA CTGGTGTCGT CACAGAATGA TTGATGGAAC ACATAGACTG 
130 140 150 160 170 180 

CATTCATTAC CTAAACATTG TCGTCACACT GCACCAACCA AAGACAATCG CATTACCCAG 
190 200 210 220 230 240 

GGGTTAGATG TAGGAAGAGT AAAAAACAAA AAATTTTTGA ATGCGTAATT ATCACTAATT 
250 260 270 280 290 300 

ATTTTATTTG ATCCTTCAGG AGAATGTGGA AGATGGCCGA GCAAGTATCT ATCAATCTGT 
310 320 330 340 350 360 

CGTTACCAAC ACCAGCAAAG AAATGTCCTG TTTCAGTGAC TTTCCAATGC CTGAAGATTT 
370 380 390 400 410 420 

TCCAAACTTC CTGCATAATT CTAAACTTCT GGAATATTTC AGGATTTTTG CTAAAAAATT 
430 440 450 460 470 480 

TGATCTGCTA AAATATATTC AGTTCCAGGT ATTGTATTTT TGGGGAAATG GGTTTCTCTG 
490 500 510 520 530 540 

CATTACTTCA GCTCATATTT AGATAGAAAA GTTACTCTGA TAATGAAAGC AATTATGAAT 
550 560 570 580 590 600 

GAAGTATCCC ATTCTAAGTA TTTGTTGAAA TATAACAGCC TCATATAAAA CCCAAAAAGT 
€10 620 630 640 650 660 

AGTGTCATTA CCCTTGGTAT TATAGATTAT ATACATTAAT TGAAGAGGAA AATCATCTGT 
670 680 690 700 710 720 

TAAAATTAAA GGTTTGAATA ATAATATATT GATGTCAAAA CTTTT 
730 740 750 760 



Figure 2 (suite) 
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ccctgagaca gagtctcact ctgttgctca ggctggagtg cagtggcatg a-ctcaactc 
10 20 30 40 50 60 

actgcaacct ccgccttcca ggctcaagtg attctcctgc ctcggcctcc agaataacto 
70 aO 90 XOO XIO 120 

ggattacagg cacacatcac catgcctggt ccacttatgt atttttggca gggacgaggt 

ttcaccattc gggccaggct ggtctcgaac tcctgacctc aagtgatcca cccgcctcoo 
190 200 210 220 230 240 

ccccccaaag tgctgggatc acaggtgtga accaccacac ccagcctcaa aaacccattt 
250 260 270 280 290 300 

aaactaatat ccgtcatcat tgaatacacc tagcttcact tgccttgaaa ogocaFatac 
310 320 330 340 350 360 

caaaattaaa tcgctgtttt gctttcttag cttcttcata gaaatgggat tccctagata 
370 380 390 400 410 420 

tgtatcaaat aaattcattg gtctccgttc acactagaag gccgtgggaa gtattcocct 
430 440 450 . 460 470 480 

accattcctt tccgaacgca atctcttaca acctaaagac ggccagacca ttttgaaaaa 
490 500 510 520 530 540 

cacttggaat taccttttcc tgtgcttcct caaaatcaac aaaaagcaat attttaatta 
550 560 570 580 590 600 

agcatgccga atctttatca atggtctata ctctgagaaa tagctaccat gcctagaaaa 
610 620 630 640 650 660 

taaaatataa atcacatttc ttggccaggc acggtgatcc atgtttgtaa ccccagcact 
670 680 690 700 710 720 

ttgggaggct gaggcaggaa gatcacttga acccaagagc ctgagaccaa cccogocaat 
730 740 750 760 770 780 

acagtgaaaa cctgtctcta caaaaaattt ccaaaagatt atccaggcat gttgataccc 
790 800 810 820 830 840 

acctgtggtc ccagctattc tagactgaga agggaggatc gcttgagcct gggaggtcaa 
flSO 860 870 880 890 900 

agctgcaata agcggtgacc gtgccactgc actccagcct gggcaacagc gtgagaccct 
910 920 - 930 940 950 960 

gtctcaaagt aaataactaa catttctgga taaacaactg ccagtgaggc ttatttttaa 
970 980 990 1000 1010 1020 

tacatgtcat tttcttagta attctaatac taggcttata taataccaac ttacaatagt 
1030 1040 1050 1060 1070 1080 

aaattttggt gaaaatttgt atttataaat tccattaaaa tgtccagttc tacctaatat 
1090 1100 1110 1120 1130 1140 

agtctttcac caattcctgg tagatctaac ttgtgaataa cagattatgt ataccagaao 
1150 1160 1170 1180 1190 1200 

gttttgtaac tttgtgcact taactatcaa tctacttaac aaatatattg cctttttatg 
1210 1220 1230 1240 1250 1260 

atatataact tctattccat tcttttaaag atcatgttag agtcocaagg aagtcatttc 
1270 1280 1290 1300 ' 1310 1320 



tcttggttat tgtgttactg ctacttttgt ttcttggaga gtgaagaggg gttggcaaaa 
1330 1340 1350 1360 1370 1380 

aaggtttctg tttattggtc tctgagttgg tgtaagtcat aggtgttaga gctcaactcg 
1390 1400 1410 1420 1430 1440 



Figure 2 (suite) 
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agaagcaggc aaactgtaac aagccctgtt gcttatgatc gccaatgcaa tctacatcao 
1450 1460 1470 1480 1490 1500 

cgcttctcaa actttaacgt ggacatgaat cacctggata tcttgttaaa aatccaaatt 
1510 1520 1530 1540 1550 iHo 

ctaatttaac aggtatgggg taagttctga aattctgcat ttctgacaag cttccaagtg 

1570 1580 1590 1600 1610 i620 

atactgaaga tcctgatcct caaatcacat tttgaatagc aaggacctac agcacttaot 
1630 1640 1550 1660 1670 1680 

taatacacta ccttgaacta ccatctgaaa tcttttcttt catctgaaaa ctecccaaat 
1650 1700 1710 1720 1730 1740 

atttaaagcc cttttacaag atttctacta acattccaca tacatcttca aattgagaca 
1750 1760 1770 1780 1790 laOO 

gcttaaaaat taccaaccca gcagttggaa aaatatctga aaatctgaga catataaaao 
laiO 1820 1830 1840 1850 i860 

actaaaatac ttgcaaatga gaagcatgcc attcctctag cattataaac ctcgcctcca 
1870 1880 1890 1900 1910 1920 

cttgacatcg tctctcaacc cagcagacat gaaacattta tgtacaattt taaaaatcaa 
1930 1940 1950 I960 1970 1980 

cagaccccca gcgagctaca tttaaaaaaa tcaatgaacc aataaatcat ttcattcaaa 
1990 2000 2010 2020 2030 2040 

taagatcatg aactgtcttg ctcacatgat gcaccctgct ttaaaaatag caaatgttaa 
2050 2060 2070 2080 2090 2100 

aaactaccac tcagtggaat gccgaccatg tgtcaggcac tctgcaaagt gtttcgcqtg 
2110 2120 2130 2140 2150 2160 

aaacatcttc tctaatacaa agtccacaaa gaggcggcta cacaaaacgc ccccgacata 
2170 2180 2190 2200 2210 2220 

tgccaattgc atgatcactt gaatcactgg tttgttccct tgttcagacc atcaaacaac 
2230 2240 2250 2260 2270 2280 

aaacagagag aagctcttca aaagaaaaga tatacatttg gtgatagagc actctaacaa 
2290 2300 2310 2320 2330 2340 

gaatgtacac gccatggtaa actatttgtg tattcaggga gttaaaggaa qacaaaoott 
2350 2360 2370 2380 2390 2400 

tttaaacggg gaaaaaatac aattacacaa tcgtttcgaa ataattatat aaaoagcaat 
2410 2420 2430 2440 2450 2460 

aacaagggtg atgccagtct gagattggac agttactgag cagatgttct tctagaaocc 
2470 2480 2490 2500 2510 2520 

atctttgtgt aagatcatga tggtctttgt gtaaggcggt ggtttttgca ccttttgtta 
2530 2540 2550 2560 2570 2580 

tcaggcacac atcatgagaa cccgctcttt ctggcctttc ccaattctat ttgtcgggtt 
2590 2600 2610 2620 2630 2640 

tcttaacatt agtgactcca tctagactct gacagttttc acgagaactt gcttttctct 
2650 2660 2670 2680 2690 2700 

tctctctcaa gtccttattc agtattcagc acccttaaca gattagtccc accgccgagc 
2710 2720 2730 2740 2750 2760 

caggcctcct gcatgaagca gcaatgagaa agacacactt ggccaatgtt atcctggagt 
2770 2780 2790 2800 2810 2820 

aattctcaat gatgccttct ctgtgtttct tcaagacaac tgcccctagt gtgagaaaat 
2830 2840 2850 2860 2870 2880 

gtccagattt ctcatcctct ggccaatgga aggttgtcac tcagagcaac ggcaaggagc 
2890 2900 2910 2920 2930 2940 

Figure 2 (suite) 
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agagtgctgt ctttgacgca gttatggttt gcagtggcca ccacattcta cctcatatcc 
29S0 2960 2970 2980 2990 3000 

cactgaagtc atttccaggt gagacccgct gggattccca gctttttgga gtaggtttcc 
30^0 3020 3030 3040 3050 3060 

aggtacttta tatgtagttt ggattgacaa gcaggattca ttgctgcaac tgggcaqaac 
3070 3080 3090 3100 3110 3120 

ttggctcaat aagattgaga cagagctaga aagatgaaag acaccaaaca tcatctctot 
3130 3140 3150 3160 3170 3180 

"""3?rS """ftJS "'""^L^S 

a«aa,tcc. .„cacaa« ..a,a,aatc cacaccaaac t„«cc«, «„a,a„c 

ccctt.a,cc ac,.,cc.,c ,t.,,cc... ..ccacccj, ccaaacacc, a.cc:«.c.c 

acagggccat acccacacac aaggggagag ctcctagaaa gaaatgcctt gcaagttagt 
3370 3380 3390 3400 3410 3420 

gatggggaga gaagtgcagg aacagaaccc tgcacccagc tgttctggcc cacccaagtc 
3430 3440 3450 3460 3470 3430 

Cttcctcaga gaacacactt ctttcccaag gcccttagga aaatatgtaa tacagtggtc 
3490 3500 3510 3520 3530 3540 

catagcccag gcctcacact agaatcacct ggggagcttc taaagccccg atggcctgga 
3550 3560 3570 3580 3590 3600 

gacctacccc caaagattca aacactatgg agcagggtta gagcaatgaa agtttgctca 
3610 3620 3630 . 3640 3650 3660 

ggtgatctta acacacagtc aggaccaagg cctgctcatc taaagcaact gctctcaaac 
3670 3680 3690 3700 3710 3720 

agagtcacct ggagggcttt tgaaagcaca aattgctagg ccccaccctc catactcctcj 
3730 3740 3750 3760 3770 3780 

attcaatagg cgctatggct tgaatgtcct gcccaaaact catattgaga tcaatcccca 
3790 3800 3810 3820 3830 3840 

atggggcagc atgaagaggt ggggcctcta agaggtgact gagtagtaag agccctgccc 
3850 3860 3870 3880 3890 3900 

tcaagaatgg attaagccat ttgtggataa ataggttaat ggattattgg gtcacacaqo 
3910 3920 3930 3940 • 3950 29€0 

agtggaactg gtggctttat aagaagagga agagagacct gagctagcat gttagcatoc 
3970 3980 3990 4000 4010 4020 

ttggctccct caccacacaa tgccctatgc tgccttggga ctcttcagag tccaaaccao 
4030 4040 4050 4060 4070 4080 

caagaaggct ttcagcagac gcagcccttc aaccttgacc tctcagcctc cacaatcota 
4090 4100 4110 4120 4130 4140 

tgccagaaga aataacttcc ttcccctata aaatattcgg tttcagacac tttgttaaaa 
4150 4160 4170 4180 4190 4200 

acaatagaag acaaattaag acagtagctc tggcatgagg ctgagaattt gcatttctaa 
4210 4220 4230 4240 4250 4260 

caccaggcaa tgctgatatt gctggccatg tgaccacact ttgagaacca ataatctaaa 
4270 4280 4290 4300 4310 4320 

gattctttca agcaacccca ccatcaatgg caaatacttt ataaagtcat gtgtttccqt 
4330 4340 4350 4360 4370 4380 
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gaagitgtaaa agtagtaact aggaaaggac acagaagaag cttgtctgcg attaaccacc 
4390 4400 4410 4420 4430 4440 

agcaagtcac ^^acttacac aatatggaaa ccaactccta tgcgcctggc ttttagtttt 
*450 4460 4470 4480 4490 4S0O 

agcttttgtt "ctctttga aaataagatc gctaaattgt attctaacta ttacacaatt 
4510 4520 4530 4540 4550 4560 

ataataatag "cttcataa tgtgcttaag aaatatttaa gagtatctga caagtgattt 
4570 4580 4590 4600 4610 4620 

""^^^^^'Ifi^n cctcactgtc acccagactg gagtgcagtg gcacgatccc 

4630 4640 4650 4660 4670 4680 

agctcaccgc aacctccaca acccccatct cccaggtcca agcaattctc ccgcctcagc 
4690 4700 4710 4720 4730 4740 

cccccaagta gctgggatta caagtgcacg accacccctg gctaattttt gcatttttac 
4750 4760 4770 4780 4790 4800 

tagagagagc ttcatcatgt tggccaggct ggctccaaac tcctgacctc agttgacccg 
4810 4820 4830 4840 4850 4860 

cctgccccgg cctcccaaag tgctgggatt acaggcgtga gccaccacac cttgcctaat 
4870 4880 4890 4900 4910 4920 

acgcgatatt aaagggccaa atgtcattat atagtccaaa atagtatata ataggcagqc 
4930 4940 4950 4960 4970 498O 

agaagacagt atctggtccc gctgtgttca tcaccactta tttgtctctg atagagacaa 
4990 5000 5010 5020 5030 504O 

actgcagccg taagctgcag cctctgaaat aaaaaatcaa cccctttggc cctgtttttt 
5050 5060 5070 5080 5090 5100 

tgtttgtttt ctgtctcgtt ttggcgttgt gacagtctca ctctgtcacc cagaccggag 
5110 5120 5130 5140 5150 516O 

tgcagtgact caatcagggg tcactgcatt ctttacttcc caagctcaag caatcctccc 
5170 5180 5190 5200 5210 5220 

acctcagtca cccgagtagc tgggaccaca ggcacgcaca accatgccca gccaacctct 
5230 5240 5250 5260 5270 5280 

gcattttttg tagacacagg gtttcactat gctgcccagg ctggtcccaa actcctgggc 
5290 5300 5310 5320 5330 S340 

tcaatcaacc ngcctaggcc tcccaaagcg ctgggattac aggccccacc tggtctggca 
5350 5360 5370 5380 5390 5400 

cctaaacttt cctatgtgcc ttacccctat agagaagagg caaaacaatt attaactcca 
5410 5420 5430 5440 5450 5460 

gaaaggaaaa gctggcaatg cagttttatt gaaattagct tgacatagtc gccctggagc 
5470 5480 5490 5500 5510 5520 

tcacagactt ctctcttctt ccccctgaag gtatggagag gttcaaaggc caatatttcc 
5530 5540 5550 5560 5570 5580 

atagccgcca atacaagcat ccagatggat ctgagggaaa acgcatcccg gtgactggaa 
5590 5600 5610 5620 5630 5640 

tgggaaactc gggctcagat atcgctgttg agctgagtaa gaatgctgct caggcgtgat 
5650 5660 5670 5680 5690 5700 

gctctctgct caccatgtac ctggagggga ggaagtgggg atgccatact ggagaacccc 
5710 5720 5730 5740 5750 5760 

agccacataa tcgcggctcc aatcctcatt aaccagctgg tcggtagcgc attgtggcat 
5770 5780 5790 5800 5810 5820 

catagaaaat ctggaagtca agaaaccact ttacctccta gctctgtcac taaccaccca 
5830 5840 5850 5860 5870 5880 
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tgaatcctag agtgattcat ttcacttccc tggqagatgg ctccctcatt tttaaaat^a 
5890 5900 5910 5920 5930 5940 

gaacttttga ccagacgatt ttccatataa gaggcctttc atcaacatcg ctcactocaa 
5950 5960 5970 5980 5990 6000 

ccttgacctc ctgggctcca atcttcctgt catcccagcc tcctgagtag ctgggactac 
6010 6020 6030 6040 6050 6060 

aggcacatgc cacaccacac tcagctaatt ttcatatatt tgtagagatg agggtcttoc 
6070 6080 6090 6100 6110 6120 

catgttgccc agggtagtct aaaactcctg aactcaagca atctgcccgc ctcagcctcc 
6130 6140 6150 6160 6170 6130 

caaagtgctg ggattacagg catgcacaac cacacccagc caagaggcct tgtctctacc 
6190 6200 6210 6220 6230 6240 

tggatgttta acgagnnagg tntaatctgt tcatattccg gagggtggct tttagaaatt 
6250 6260 6270 6280 6290 6300 

tagtgtgtat ttgaattata tttgaaatat agataacctt cagttaccca aatactatga 
6310 6320 6330 6340 6350 6360 

aaagaaagac taaatagata gtaggtctct caaccaaaat catagatatt taggtgcctc 
6370 6380 6390 6400 6410 6420 

ccgaggcctt ctaaccactg tcttctttgc acctgctcag gaatgacacc agctgagctg 
6430 6440 6450 6460 6470 6480 

ccaaagagtc aaacattcat tacatgatga tgctgctgac agtggtggtc aggaatagca 
b490 6500 6510 6520 6530 6S40 

aaaactaaac tccccctgca aggacagacc taggcaaaga agggaaaacc actaaacatc 
6550 6560 6570 6580 6590 6600 

ctttcccaaa gtattccctc tcaagaaggc ctgaaccaga tgcccaatca ctcctacccc 
fifi" 6620 6630 6640 6650 6660 

agccctttca gcctgacgtc tctggccacc cagggcctac cacggccccg tgcacaacca 
6670 6680 6690 6700 6710 6720 

acaaatcatt tccatcctaa gtctcacacc ttcaggaccc tagacaccca gtggcaaaag 
6730 6740 6750 6760 6770 6780 

ttacaagcaa acatgacacc cgcccagcag gttaatgaag gggccatacc gggacctgcc 
6790 6800 6810 6820 6830 6840 

agagccatct atcagtcagt tagttagtgc cagcccggga acagagcagg tcactaacac 
6650 6860 6870 6880 6890 6900 

cggaaagaga cttactagac ccaataagtc ttcactttgt gaaaataaac cccttgtcac 
6910 6920 6930 6940 6950 6960 

ttatcacctc agtgtgaaga acaagtgagg aggcaggaac tgtgacagcc tggagaagag 
6970 6980 6990 7000 7010 7020 

cagagctgga aaatgagagt accagctcta ggctctttca tgctacgaat acccgcaaag 
7030 7040 7050 7060 7070 7080 

ccttaggaac agagtgcaat ggggcagtat gtgaggagcc aatatagcag tcagccaagt 
7090 7100 7110 7120 7130 7140 

gaagatccat cctagactac ttcacgttgt cagaccagtg atttggactt agatctcttc 
7150 7160 7170 7180 7190 72C0 

attccaaaga taccaaatct tagatggcaa gaaccagttc cttgtatggg tcttgcccta 
7210 7220 7230 7240 7250 7260 

caggaagact tatggtgtga gattcaatat taagaaacta ccttggctct attcgcatgc 
7270 7280 7290 ninn ^ -..--T 



7270 7280 7290 7555 ^^nlo 7325 

cttttgcaca gagtgcaaa^ 
7350 736C 
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ctatcagtgc aaatgccact agatgccccc ttcttaggag gtacttcacc ttgaggtcaa 
7390 7400 7410 7420 7430 7440 

tcatctttaa aacagagccc cagtaaattc tggggctatg cacgtgatac atcacctaca 
7450 7460 7470 7480 7490 7500 

taatagattc ctcctaaaca taatgttata accatacatt tccaggatta cactcattca 
7510 7520 7530 7540 7550 75S0 

cctgcactaa tctcttcaat atttattaga gtaacaacat aaatctataa ccacgataaa 
7570 7580 7590 7600 7610 7620 

acctcttaca cagagcaata tactctcaag ccttctgtga aaagactaac cagagacctt 
^«30 7640 7650 7660 7670 7680 

acaggagcta tacatgctag gaacggaacc aggcgcatct gcaaaacttg aaatcacaac 
7690 7700 7710 7720 7730 7740 

ctgaactcac caaaattctg agtgtgcact gctctgttaa aagaaattca cccccacaag 
7750 7760 7770 7780 7790 7800 

gccacagcac cctctaccac aatccaaaag caccactcaa gaccacacgg gatggtgctg 
7810 7820 7830 7840 7850 7860 

catcattgta ttagtccatt ctcaacgctg ccacgtagac acacccgaga ctgggtaact 
7870 7880 7890 7900 7910 7920 

cataaagaaa agaggtttaa ttgacttaca gtttggcatg gctggggaag cctcaggaaa 
7930 7940 7950 7960 7970 7980 

ctaacaatca t^acggaatg cacctctcta cgaggctgca ggagaaagaa tgagagcgac 
7990 8000 8010 8020 8030 8040 



tggggaaccc cttataaaac catcagatct cgtgagaact tactccctat taggagaaca 
8050 8060 8070 8080 8090 8100 

gcatggcaga aacccccccc acgactgaat tatctccacc tggtcctgcc cctgacacgt 
8120 8130 8140 8150 8160 

ggggattatt acaacctaag gtgagatgcg ggcagggaca cacagccaaa ccacattagt 
8170 8180 8190 8200 8210 8220 

catttacata cttctgacca aaaaccaaat ctctggccct tgacccaaaa cacgcgtctc 
8230 8240 8250 8260 8270 8280 

agagaaagca 9cctgagcct aaatcctcat 9Cttctctca ctgttgcagc tagtgtcacc 
S290 8300 8310 8320 8330 8340 

aaggcaggcc agaccaccct gctgtaggga gggccacaac agaaaaagag tgaatcaaac 
B350 8360 8370 8380 8390 8400 

gggcagagca taccatttga aacatggttc gctcctgaga aagaagaggg gacagtaagt 
8410 8420 8430 8440 8450 8460 

aatggaaaga gacactaatg aaaatatttt tgtatctaat atctaatcaa agtattgcca 
8470 8480 8490 8500 8510 8520 

agtcagccta taagggcaac ggcaggagaa attcagaaca taggtacaca ccacacacag 
8530 8540 8550 8560 8570 8580 

accagcaata taggaatgcc tggtataggt gctacttcac aagctaggaa cgtaaggccc 
BS90 8600 8610 8620 8630 8640 

atccccacaa aatttgtctc caaattctgg tttactccag acataaggca ctgcatgaaa 
8650 8660 8670 8680 8690 8700 

ctcctctctt ccagcctaac tttataactt aacagctagc agcacttatc acttgccagg 
8710 8720 8730 8740 8750 0760 

caatatttca agtactttat atataccacc tcatttaatc tacacaagaa taccataaco 
8770 8780 8790 8800 8810 8320 
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taggcaccqt taataccccc attttacaga gagagaaact gaggcacaga gagattgaaa 
8330 B840 8850 8860 8870 8880 

taactcaacc atggcaacac agattgaaat agtccaccca cagcagtgtg attggcattc 
8390 8900 8910 8920 8930 8940 

aaacccaagc agtctgtatc caaacctctc aagtaaattg gttaccttgc aagtgaatct 
8950 8960 8970 8980 8990 9000 

tatgtgttta tcaagtatag ccttaaacaa aaacttattg catggtatgt aaaaactcaa 
9010 9020 9030 9040 9050 9060 

gaagcagttc aagtatgcat ttggccaacg ggggagtaac agcaaacaca gcaaaacata 
9070 9080 9090 9100 9110 9120 

catttgaaaa gagattaaat gtacattttg gaaacaaggg aaaccttaac aaacaaggta 
9130 9140 9150 9160 9170 9180 

aagaacacac ctgaaagagg attcagacgt gcactcgaag agaaagagaa tcacagcata 
9190 9200 9210 9220 9230 9240 

agtccagagt ttttaacttt taaaatacat tacaagcact gtgcctcatg cctgcaaccc 
9250 9260 9270 9280 9290 9300 

cagcactttg ggaggctgcg gcaggaggat tgcttaagcc cagaaatctg agaccgacct 
9310 9320 9330 9340 9350 9360 

gggcaacaca acgagaccgc ctctacaaaa aaatcgtctg aaccagccgg atgtggcggc 
9370 9380 9390 9400 9410 9420 

acacgtctga taccgaggtg ggaggatcac tcgagcccgg gaggccgaga ctgcaacgag 
9430 9440 9450 9460 9470 9460 

ctatgactgc acaaccgcag cccagcccga gcgacagagc aagaccccgc cccacacaca 
9490 9500 9510 9520 9530 9540 

cacacacaca cacacacaca cacacacaca aaataaagtc tcccaagca^ ggaaggaaga 
9550 9S60 9570 9580 9590 9600 

ctatttcccc tgttactccc cacccaggga catLcagacg cacacacacc cacacttgcg 
9610 9620 9630 9640 9650 9660 

cagccaccag gctacaatcg cacacctcca aggattacaa ccatcctacc cgcaccacag 
9670 9680 9690 9700 9710 9720 

aagaaactca ggtgagtgga aaacacgaga ggagggaggg aggaaccttc tctcaaggag 
9730 9740 9750 9760 9770 9780 

cagcaaacca caactgtaaa catgggaaag acctgtggat tttatcatca gagccagccc 
9790 9800 9810 9820 9830 9640 

aaagactttc tcgtgcctcc acgaagcncc caagattttg ttgcagtcct cccgcaccag 
9850 9860 9870 9860 9890 9900 

tgcaaacgcc actgggtacc cctatttagg aggcactcca caccgaggtc aatcaccttt 
9910 9920 9930 9940 9950 9960 

aaaacagaac ctctgcaaat tctggggcca cacacgtgat: acacgaccct cacagtagac 
9970 9980 9990 10000 10010 10020 

tcctcccaaa cgggacaatg ccctaattca aactgcatcc ctttttgctt gccaggtctc 
10030 10040 10050 10060 10070 10080 

catcagcacc aggcatggca cccgggccac gagccgtacc tctgaagatg gctatcctcg 
10090 10100 10110 10120 10130 10140 

ggactcagtg ctccacaccc ggrttcgccc racgctccgc aacgcaccgc cacgaacagc 
10150 10160 10170 10180 10190 10200 

tgtaaaatgg atgatagaac aacagatgaa tcggtggctc aaccatgaaa attatggccc 
10210 10220 10230 10240 10250 10260 
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tgagccccaa aacaagtaga gttattttgc ttttttaatq gtacactccc tggtcaocaa 
10270 10280 10290 10300 10310 10320 

agttgtctga aggcgtctcc cttaacaaag attcaaattg ctaacacgct aottaaaaet 
10330 10340 103S0 10360 10370 10380 

acaatctaac aatatgagta tcttataggt cctggagttt agcttctaaa tttooactoa 
10390 10400 10410 10420 10430 10440 

acccctttaa aaaatacgta agaagatgaa gcagaagtgt tataagccgc tccaaaaaac 
10450 10460 10470 10430 10490 10500 

aaaactaggg gagaactttc taatacccag aqctatctaa cactggagaa aaccotttPA 
10510 10520 10530 10540 lOSSO 10560 

agagattacg acctgccttc cagaggggtg tggtgggaaa catgtaattc tccatccaac 
10570 10580 10590 lOSOO 10610 10620 

aatttatgcc ttgctaaccc tatagcacga aggctcttcc catgggaaac ctttoaaaae 
10630 10640 10650 10660 10670 10680 

acattccttt ttctttgcta aaagacaaat ctctgctgan cgtcaaagtt atatntcaot 
10690 10700 10710 10720 10730 10740 

gatttaagca caagcaaacg ttatgaatgg ctcttttgct ttagttgtta caggcttctt 
10750 10760 10770 10780 10790 10800 

cccttaaaaa aacagaagag ctttagaacc ttttaacaaa tgcctgccgt gcaactacca 
10810 10320 10830 10840 10850 10860 

tattctaaga tccgacacaa gtgccacgta tcgcctatca aaaaaagaaa aagaaaatgt 
10870 10880 10890 10900. 10910 10920 

tctcaaatct acaaaaaaaa taagcggact tcgcatcaac atccatgcta tcactaacag 
10930 10940 10950 10960 10970 10980 

agactccatg gatatttggg attaacaaat atcaccaaac ctaattttat acatcaatct 
10990 11000 11010 11020 11030 11040 

tcacattgat cccttcatag atLtcaaaac tagtggaaat ttagcaaatt ttttcttatg 
11050 11060 11070 11080 11090 11100 

atcaaatagg ggttaaacaa aacagcaaaa taataaaagc tagatagcat gaaaaaggtt 
11110 11120 11130 11140 . 11150 11160 

aaaaacagaa atggtataat aaccaccaca atacttgggg attgaccata ggcacaggca 
11170 11180 11190- 11200 11210 11220 

ttttgtctaa gcccttgggg acgcttccct ccttaaaatc tctttcactc acgttoccca 
11230 11240 11250 U260 11270 11280 

catgttttcc cctatttatt gacaagagac atctgtgaca tgagaattaa gtcagaaaat 
11290 11300 11310 11320 11330 11340 

aaggatttgc acagacaacc agttaagtta gagttttaca gatatttgaa aaoccctttt 
11350 11360 11370 11380 11390 11400 

attttcagag ccgtacccca aaaatatcaa gagggttcaa gattcctcag caaatcatcc 
11410 11420 11430 11440 11450 11460 

ctcagaatgt ttttcttctg tacgtctcag atacattatg aaggaacctg tactaaatoa 
11470 11480 11490 11500 . 11510 U520 

tgatgtccca agtcgtctac tctgtggagc catcaaggtg aaatctacag tgaaaoaoct 
11530 11540 11550 11560 11570 llSBO 

cacagaaact tctgccatct ttgaggatgg aacagtggag gagaacattg atgccatcac 
11590 11600 11610 11620 11630 11640 

ttttgcaaca ggatatagct tctcttttcc cttccttgaa gattcactcg ttaaagtaoa 
11650 11660 11670 11680 11690 11700 

gaataatatg gtctcactgt ataaatacat attccccgct cacctggaca agtcaaccct 
11710 11720 11730 11740 11750 H760 
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c,c,t,=«. a,c=c«a,, t.ccactccc ccaa«,«, aaccccaa,c 

cc,«„,c, a=aa,a,tcc .caaa^caa ,c,.,ca,,c a„c,a,c„ =caa,c,c|C 

=a,ac«„. ,aa,t««c aataatjata a,aa,,«,c cc,a,acaaa aa„..,cca 

a,aaaaa,.. „acaac=« acaa,a«aa =a«cjaaaa a,«act„a 

gaatecaaag aataacaaac acag^aattt agtaacaata aataccegca aecatccttc 
12010 12020 X2030 12040 12050 12060 

caaaaeatca gacagtcaag agaatttcaa ctggcacaaa gctaaqtgca tgttaactcc 
12070 12080 12090 12100 12110 12120 

cctttgaatc gcgagagata agcttaagaa aaagatctgt ctcctqgctt tacccctgtg 
12130 12140 12150 12160 12170 12180 

ccgtctaaaa attccccagc atatccgcaa accaatttaa ctctcaacac ttgagcagcc 
12190 12200 12210 12220 12230 12240 

caaccccaca aatccctaca agctataaaa ttattaaaag gtttccctct gggtgtctgt 
12250 12260 12270 12280 12290 12300 

geagcacctc acactcctca gaacggtgct acccccctgc ctccag<„tt caattccgcc 
12310 12320 12330 12340 123S0 12360 

cagcaaaagc ttactgaata ccttgccccg tgctgggaac tggtgggaca gagagaaacc 
12370 12380 12390 12400 12410 12420 

taaacagatc atttcaacat aacatgacaa atgccttgat tgaacaatat acggagcgct 
12430 12440 12450 12460 12470 12480 

cagggaagga gagaaagggc acttatcacg gtagaacaag ggaagggcac atgataaagg 
12490 12500 12510 12520 12530 12540 

aaaacgtccc 95acaactgc atttcEcag, ggcagaaaag gggactgccc gaacaaaagc 
12550 12560 12570 12580 12590 12600 

atagagtcaa cgatgcacat ggaagggcac atgccacttg acaetgctag agcacqacgt 
12610 12620 12630 12640 12650 £2660 

acgaggcaga gagagatgag ccattactct tggagaagaa ggagacagga cacaggaatc 
12670 12680 12690 12700 12710 12720 

ttttaagaca tgctatggag cttagatcat aaattataga tcagttcctc ccaaatatgg 
12730 12740 12750 12760 12770 12780 

ctacatatga aaatcacctg atggaccctc agggaccccg attaagtaag actggccaag 
12790 12800 12810 12820 12830 12840 

ggaccjggaa .ccgcatct. agaaagctct .cagcccgg, ,=a==...,a aggg.cacaa 

'=-'--2 '""j^tfo^ '"^ntiVo '"'^niis 

atatagattt gaaagtgggg aaagactaca gcctcaggga tgaaagagaa agctactgaa 
12970 12980 12990 13000 i3010 13020 

atagcctacg ctaaaatatg atgcatcctg ggccagggca gagatacaaa gtggaaagga 
13030 13040 130S0 13060 13070 130B0 

agccataaat gtgagaaatc attaagggaa aaatcagcac gacatcatga ttggttcaat 
13090 13100 13110 13120 13130 13140 

gtgggaaagt cagagaaata gagaggaatc taggaggacc tacagatctc tggcattgga 
13150 13160 13170 13180 13190 13200 
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aaccaggtgg acagtagtgc tgtgaataca gagggggtgt gcagaaaacg atgcaaotct 
13210 13220 13230 13240 13250 13260 

ggacaggagg gcttcagtga ggagctcagg tctggactac tcgaacatga gatg-ctoa^ 
13270 13280 13290 13300 13310 lUto 

gactctaggc aaggggactt gaccatattt caacacatcc aaagctcagg ggacacttoc 
13330 13340 133S0 13360 13370 iJisO 

gggcaggcga tggagtcatg agcacacagt aataacctct gcatcaatct ttccctatet 
13390 13400 13410 13420 13430 13440 

ctactgccct actctcatct ctcaccaggt ttacttcaac agcctcttta ctggtctccc 
134S0 13460 13470 13480 13490 13500 

cagctctggg cttgcctccc tggagtccac ttccctaaat tcagcagcca gacagatcct 
13510 13520 13530 13540 13550 13560 

tccaaaaaat aaatctgatc ttctcacttc attcagaata ctcttccact gatctoattt 
13570 13580 13590 13600 13610 13620 

ggggccccct gtcaccttca ggatagagcc caaaccacta gtcacggccg ccaggctccc 
13630 13540 13650 13660 13670 13680 

agacacactt cccccctcca gcctcttctc ctggccctct ccacctgtag tccacgccgc 
13690 13700 13710 13720 13730 13740 

agactgtgca ccctggacag tgtcacacag agcgctatgg gggcggcacc ccctgaagcc 
13750 13760 13770 13780 13790 13800 

caacagcacg gaagccctga ccggtatgac atggcccaat gcccagagtt taattttaag 
13810 13820 13830 13840 13850 13860 

aaccaacaac tagacaaagc aatgatattg acccaaacct actattcaaa ccaaccttct 
13870 13880 13890 13900 13910 13920 

attccttagg cttgtgtagc ctgccctcag agagaaccat gacgacggac attatcaaaa 
13930 13940 13950 13960 13970 13980 

ggaatgaaaa aagaattgac ccgtaagaat tttttttaac cccttacacg aagcagcgtt 
13990 14000 14010 14020 14030 14040 

tctcaaagta cagtgatcta actacttaca agaaccacct agctgcccga caaaatgcaa 
14050 14060 14070 14080 14090 14100 

atttctgggc tacagcccag atgattgaac cagaaactcc gtgngtgagg ccaaaaagcc 
14110 14120 14130 14140 14150 14160 

gcatttttat cttcctccta agcgattctt atacatacta ggttaagaac caaataccca 
14170 141B0 14190 14200 14210 14220 

aagataagaa ttgtaccaaa tcagagcacc tctccttggc ttaatttcat ttcagtttta 
14230 14240 14250 14260 14270 14280 

tatgacgcct atgtcagact ccataacttc tcaagccacc cacactctgc ggttagagag 
14290 14300 14310 14320 14330 14340 

ggantgggat gagacagcgg tggtgatagt agcttgaaca gctgtgaaaa gtcagagaat 
14350 14360 14370 143B0 14390 14400 

ccccatcaga ataaattagg aaggggttgg tgtgaaggtt caaggatctg tactttgtga 
14410 14420 14430 14440 14450 14460 

tgaggtaaaa tgaggttcaa cagtgatcga gcacccttgg aaagttgatt tggggcctac 
14470 14480 14490 14500 14510 14520 

atcaggtgta aagagttttc tcatgttcaa attcaaattt acctaagact gaccgagtat 
14530 14540 14550 14560 14570 14S80 

ctactatacg ccatccagac tgccaggtac tttagtaatt taacaagcaa acattaagca 
14590 14600 14610 14620 14630 14640 



Figure 2 (suite) 
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fragments . FM02 

tctcctttga 9caagacacc aagctatgct ttcatatgca ttatcccatg aattcctoca 
- 14650 14660 14670 14680 14690 

gccgccctgg ctagcatgta cttgcctgga gattcgccac cgcttaaaaa atCTccaaarA 
14710 14720 14730 14740 14750 14760 

atggccacca accctgtcac atttctagag catccatgaa ttcatgactc ttratrh^*^ 
•14770 14780 14790 14800 14810 14820 

ggcgtattct caatctgaga tatgagcctc ctggtatgat aaactcaaac tttccaccao 
14830 14B40 14850 14860 14870 I488O 

agattcattg aaaactcatt cacatattca cccattcctt cattccttta gcaattttoA 
14890 14900 14910 14920 14930 14940 

atgcctaaca ttctagaaaa cttagaacat tctgtgaaca ttcccttttt actttctrcA 
14950 14960 14970 14980 14990 IsSoo 

ctaaggtttg gagaaagcca gagccagacg ttgcagacca attatgttga ctacttacac 
15010 15020 15030 15040 ISOSO 15060 

gagctcgcct tagagacagg tgcgaagcca gatttctgct ctctcttgtt caaagatcct 
15070 15080 15090 15100 15110 1S120 

aaactggctg tgagactcta tttcggaccc tgcaactcct attagtatcg cctgatcooa 
15130 15140 15150 15160 15170 15180 

ccngggcaat gggaaggatt cagaaacgcc atcttcaccc agaagcaaag aatactgaag 
15190 15200 15210 15220 15230 15240 

ccactcaaga cccgggccct gaaggattca tccaatttct cagttccctt: tctgttoaaa 
15250 15260 15270 15280 15290 15300 

atcctgggcc ctcttgctgt tgttgcggcc tttttttgcc aacttcaatg gccctaotca 
15310 15320 15330 15340 15350 15360 

gcataatgct ttgggcttta ttatctcgtc agtcactacc tcctaaagaa aaaaaaaaag 
15370 15380 15390 15400 15410 15420 

gctagaagaa aaaacattac actcatgttc taattataga ctttagagtt aggcaotaca 
15430 15440 15450 15460 15470 IsJao 

ggtaaggggg aaattgtaaa gaattagcag aactaggcat atgtacaaaa ccaaaatttt 
15490 15500 15510 15520 1S530 15540 

gtcatgaaat tttgcctttc cacgcttccc ccagttcacc aaagttacca aaacgcaaaa 
15550 15560 15570 15580 15590 15600 

taaaacaaga ccggctcagg taagtagtgc tgccaaccct gatacagggg agctgcatgc 
15610 15620 15630 15640 15650 15660 

aaaaatagta gaattacaca gcatgaaaag cagcccatgg tttaaattat tggacaactt 
15670 15680 15690 15700 15710 15720 

aaattgtggg taaatattta aaactcctga acaatgtttc tgatggtctc ctatccaccc 
15730 15740 15750 15760 15770 15780 

tacttggtaa caaagttctc agatgttagg tcatgtttca tttgctcagt cggggatcac 
15790 15800 15810 15820 15830 15840 

tcaaaactac tagacaaaaa agtgagagga tagatttaga aaacatcagt gatgctcaga 
15850 15860 15870 15880 15890 15900 

taaactttta ggacctcata ttaagagcca agcaaatggc cacatttcct atattttgac 
15910 15920 15930 15940 15950 15960 

agagatactg ctggaaaaat taaaattaaa atgccataat agctacctaa caaatatata 

15970 15980 15990 16000 16010 16020 

tgtttaatgc ctatca&agg ccagacattg tgctatgtgc atatcatatg tactacttca 
16030 16040 16050 16060 16070 16080 

tttaattctc acaacaattc tgtgaaatgg taacagctat tatagtcatc tcacagatga 
16090 16100 16110 16120 16130 16140 

Figure 2 (suite) 
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fragments . FM02 

tgaaactaag atrcagagca gccgatcttg tgaggcagct ggaatcggaa ctcagattta 
L6150 16160 16170 16180 15190 16200 

ttgaactcta gaactaaaga tcataatgct gtcttgtaat atatttattt acaaaacact 
16210 16220 16230 16240 16250 16260 

tcattattta caaagaattt actaacagtt tatcttattt atacccatac atctocta^t 
16270 16280 16290 16300 16310 16320 

ttgggaggcc ctttacatag aaaacagcat tctttttgct aaatatgacc aaattacttt 
16330 16340 16350 16360 16370 16380 

tatttataat tttcgattta tatttcagct agatctaaaa agcatctgaa ggaatttaca 
16390 16400 16410 16420 16430 16440 

atgaaagata cccatgcaat aacacttagg ataatctttg acattttgga aaaataagaa 
164SO 16460 16470 16480 16490 16S00 

ttgaggaaaa aaagtgcatc tttcaagtag atgcaaagca tcataatgat tgacacttgt 
16510 16520 16530 16S40 16550 16560 

• atctaactcc agtcttacag ataactaagg caaaaagcta aataaacaat acgcaacctc 
16570 16580 16590 16600 16610 16620 

taacatttgg taaaaggaag tatactggtc tgtcagcaga gacaaactct ttttagaact 
16630 16640 16650 16660 16670 16680 

gaagtccgaa acaaacaaaa gcaactcaat gtcaacagac attaagcaac acaatagaca 
16690 16700 16710 16720 16730 16740 

aacatctcct aagggaacat ttgccacagc tgctccttcc ctgaactgtg ctLtggaaga 
16750 16760 16770 16780 16790 16800 

taagctccgt cctgagtcca aaccaagccc ttccaagaga gaacaaaggt cagagatqtt 
16810 16820 16830 16840 16850 16860 

gaagattcca gcaaatctct cctcttattt ctaccaagcc tttgtgaaca ttgctcttca 
16870 16880 16890 16900 16910 16920 

ttttggcctg cacttctccc tcagggacgt agaacaacgg aatgccagtc agcctctgta 
16930 16940 169S0 16960 16970 16980 

gttaaaactc tttctttaaa attcaattaa gccacccctc cctcagggac gtagaacaat 
16990 17000 17010 17020 17030 ' 17040 

ggaatgtcag tcagtctctg cagttaaaac ttttccttta aaattcaatt aagttacacc 
17050 17060 17070 17080 17090 17100 

agaatttaca ggcaagattt tttttttcat tgctcccata agcaaatttg tttcaaaata 
17110 17120 17130 17140 17150 17160 

attgtaaatg aggtatatac ttagttcttg gttaaaaaac atattgcctt gttaagtatt 
17170 17180 17190 17200 17210 17220 

aaagattatt tgtaagtcat tgtattaata atactaataa aatttatcaa gcctttatag 
17230 17240 17250 17260 17270 17280 

caagggccag tgaatcacca ctgcctgtgg gccaaatcta gctcactacc tgtttttgta 
17290 17300 17310 17320 17330 17340 

aataaaattt tataatagta cacagccaca ctcattcact tattttctgc ggttgctttc 
17350 17360 17370 17380 17390 17400 

aagctacaat tgtagagttg ggtagtcgca acagaatctc tgtggcccac aaggctaaaa 
17410 17420 17430 17440 17450 17460 

tatttacatt cccacccatt acagaaaaag tttgataatt cctgctttat aatatgcaag 
17470 17480 17490 17500 17S10 17520 

gcattgtccc attttgcata acttgcctta tttcatcatt accactaccc atttagtagc 
17530 17540 17550 17560 17570 17580 

tatggttgtt atcttacttc tacagtggaa gagattgaaa agcatttgtc aggttaatgc 
17590 17600 17610 17620 17630 17640 



taaatcagtg cggaaatata gctc 
17650 17660 
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FIGURE 3A 

FM02 position sur le gene position sur le mRNA 
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1 : 


2001 - 


2056 


1-56 
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2 : 


2405 - 


2542 


57 - 194 


Exon 


3 : 


10026 


- 10214 


195 - 


383 


Exon 


4 : 


13341 


- 13503 


384 - 


546 


Exon 


5 : 


16036 


- 16178 


547 - 


689 


Exon 


6 : 


20558 


- 20757 


690 - 


889 


Exon 


7 : 


21972 


- 22327 


890 - 


1245 


Exon 


8 : 


24411 


- 24483 


1246 - 


1318 


Exon 


9 : 


25487 


- 25899 


1319 - 


1731 


ATG 




2411 - 


2413 


63-65 




Stop 
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25838 


1668 - 


1670 



FIGURE 3B 

FMOx position sur le gene position sur le mRNA 
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2001 
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1 - 


138 
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6961 


- 7149 


139 


- 327 


Exon 


3 : 


10144 


- 10306 


328 


- 490 


Exon 


4 : 


11413 


- 11555 


491 


- 633 


Exon 


5 : 


13347 


- 13546 


634 


- 833 


Exon 


6 : 


15697 


- 16052 


834 


- 1189 


Exon 


7 : 


17930 


- 18002 


1190 


- 1262 


Exon 


8 : 


24838 


- 25180 


1263 


- 1505 


CDS 




2006- 


25180 


6 - 


1605 
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homologie FM02 



Longueur % homologie Macaque/hoirane h homologie Macaque/homme 
Acides Amines adn 



exon 1 64 
(5'UTR) 



exon 8 72 96 



95.3 



exon 2 137 lOO 96.5 

exon 3 188 9 8 96.8 

exon 4 162 96.7 96.9 

exon 5 142 95.8 96.5 

exon 6 199 95.4 97 

exon 7 355 98,3 97.7 



97.2 



exon 9 413 93 95 

(3' UTR) 



Pourcentage 96 96 7 

Global 



Figure 4 
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Variation homme /macaque sur FM02 



position mRNA macaque | base macaque | base humain | amino acid 



56 
71 
83 
104 
197 
218 
266 
284 
344 
360 
404 
455 
482 
499 
510 
54 8 
604 
629 
650 
676 
725 
729 
743 
758 
811 
844 
995 
1085 
1121 
1133 
1145 
1155 
1157 
1160 
1251 
1252 
1370 
1448 
1450 
1473 
1484 
1486 
1509 
1510 
1514 
1516 
1535 
1541 
1556 
1567 
1590 
1598 
1623 
1646 
1577 
1678 



A 
A 
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C 

c 
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T 
G 
T 
G 
T 
A 
T 
T 
G 
A 
G 
T 
T 
A 
C 
A 
T 
G 
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C 
A 
C 
G 
C 
G 
G 
A 
G 
A 
T 
C 
C 
G 
C 
T 
G 



G 
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T 
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T 
T 
C 
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C 

c 

G 
A 
G 
C 
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A 
A 
C 
A 
C 
A 
C 
G 
C 
C 
A 
C 

c 
c 
c 

G 
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G 
C 
C 
A 
N 
G 
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N 
N 
A 
A 
G 
A 
C 
C 
T 
T 
C 

T • 

C 

A 



non codant 



Lys -> Asn 



Ser -> Thr 
lie -> Phe 
lie -> Met 
Ser -> Phe 



Asn -> Ser 
Val -> He 



Val "> Ala 
Arg -> Gin 



Glu -> Asp 
Phe -> Leu 



Ser -> His 
Ser -> Kis 



Tyr -> Phe 



Figure 5 
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Aligixement-iiiRKAPH02 



Macaque453 IMMU59453 Kacaca mulatta flavin-containing mo 6431 6431 6479 
96.7% identity in 1721 nt overlap 



10 20 30 40 50 60 

mRNApo t AACCAAGGGAGAAAACTATTCTGTCAAAGAGACGGTGCCAAAAGGC AAAAAC AAAGGAGC 

Macaque GGCACGAGGAAAACTATTCTGTC-AAGAGACGGTGCCAAAAGGCAAAAACAAAGGAAC 
10 20 30 40 50 

70 80 90 100 110 120 

mRNApo t TGATGGCAAAGAAGGTAGCTGTGATTGGAGCTGGGGTCAGTGGCCTAATTTCTCTGAAGT 

Macaque TGATGGCAAAGAAAGTAGCTGTGATCGGAGCTGGGGTCAGTGGCCTGA'I^TCT^ 
60 70 80 90 100 110 

130 140 ISO- ISO 170 180 

mRNApot GCTGTGTGGATGAGGGACTTGAGCCCACTTGCTTTGAGAGAACTGAAGATATTGGAGGAG 

Macaque GCTGTGTGGATGAGGGACTTGAGCCCACTTGCTTTGAGAGAACTGAAGATATTGGAGGAG 
120 130 140 150 160 170 

190 200 210 220 230 240 

mRNApo t TGTGGAGGTTCAAAG AGAATGTGGAAG ATGGCCGAGCAAGTATCTATC AATCTGTCGTTA 

Macaque tgtggaggttcaaagagaaggtggaagatggccgagcaagcatc™^ 

180 190 200 210 220 230 

250 260 270 280 290 300 

mRNApot ccaacaccagcaaagaaatgtcctgtttcagtgactttccaatgcctgaagattttccaa 

Macaque CCAACACCAGCAAAGAAATGTCCTGTTTTAGTGACTTTCCAATGCdCGAAGAT 
240 250 260 270 280 290 

310 320 330 340 350 360 

mRNApo t ACTTCCTGCATAATTCTAAACTTCTGG AATATTTCAGGATTTTTGCTAAAAAATTTGATC 

Macaqu e ACTTCCTGC ATAATTCTAAACTTCTGGAATATTTC AGG ATTTTTGCC AAAAAATCTG AT^ 
300 310 320 330 340 350 

370 380 . 390 400 410 420 

mRNApo t TGCTAAAATATATTCAGTTCCAGAC AACTGTCCTTAGTGTGAGAAAATGTCCAG ATTTCT 

Macaqu e TGTTAAAATATATTC AGTTCCAG AC AACTGTCCTTAGTGTG AG AAAGTGTCC AG A'nT 
360 370 380 390 400 410 

430 440 450 460 470 480 

mRNApo t CATCCTCTGGCCAATGGAAGGTTGTCACTCAGAGCAACGGCAAGGAGCAGAGTGCTGTCT 

Macaque catcctctggccaatggaaggttgtcactcagagcaatggcaaggagcagagtgctgtct 

420 430 440 450 460 470 

490 500 510 520 530 540 

mRNApo t TTGACGCAGTTATGGTTTGCAGTGGCCACCACATTCTACCTC ATATCCCACTGAAGTCAT 

Macaque ttgatgcagttatggtttgcactggccaccactttctacctcatatcccactgaagtcat 

480 490 500 510 520 530 



Figure S 
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Alignement -inRNAFM02 



550 560 570 5B0 590 600 

mRNApo t TTCCAGGTATGGAGAGGTTC AAAGGCC AATATTTCCATAGCCGCCAATAC AAGC ATCC AG 

Macaqu e TTCC^GGTATCGAGAGGTTCAAAGGCCAATAT^ 

540 550 560 570 580 590 

610 620 630 640 650 660 

tnRKApo t ATGGATCTGAGGGAAAACGCATCCTGGTG ATTGGAATGGGAAACTCGGGCTCAGATATTG 

Macaque ATGGATTTGAGGGAAAACGCATCCTGGTGATCGGAATGGGAAACTCGGGCTCCGAT^ 
600 610 620 630 640 650 

670 680 690 700 710 720 

mRNApo t CTGTTGAGCTGAGTAAGAATGCTGCTCAGGTTTTT ATCAGC ACCAGGCATGGCACCTGGG 

Macaque CTGTTGAGCTGAGTAAGAGTGCTGCTCAGGTTTTTATCAGCACCAGGCATGGCACCTGGG 
660 670 680 690 700 710 

730 740 750 760 770 780 

mRNApo t TCATGAGCCGTATCTCTGAAGATGGCTATCCTTGGGACTCAGTGTTCCACACCCGGTTTC 

Macaque TCATGAGTCGTGTCTCTGAAGATGGTTATCCTTGGGACTCGGTGITCCAC^ 

720 730 740 750 760 770 

790 800 810 820 830 840 

mRNApo C GTTCTATGCTCCGCAATGTACTGCC ACGAAC AGCTGTAAAATGGATG ATAGAAC AAC AGA 

Macaque GTTCTATGCTCCGCAATGTACTGCCACGAACAGTTGTAAAATGGATGATA^ 

780 790 800 810 820 830 

850 860 070 680 890 900 

mRNApo t TGAATCGGTGGTTC AACC ATG AAAATTATGGCCTTGAGCCTC AAAAC AAATAC ATTATG A 

Macaque TGAATCAGTGGTTCAACCATGAAAATTATGGCCTTGAGCCTCAAAACAAATACA'n'ATGA 
840 850 860 870 880 690 

910 920 930 940 950 960 

mRNApo t AGGAACCTGTACTAAATG ATGATGTCCCAAGTCGTCTACTCTGTGGAGCC ATC AAGGTGA 

Macaque AGGAACCTGTACTAAATGATGATGTCCCAAGTCGTCTACTCTGTGGAGCCATC^ 
900 910 920 930 940 950 

970 980 990 1000 1010 1020 

mRNApo C AATCTACAGTGAAAGAGCTCACAGAAACTTCTGCCATCTTTGAGGATGGAAC AGTGGAGG 

Macaque AATCTACAGTGAAAGAGCTCACAGAAACTTCTGCCATTTTTGAGGATGGAACAGTGGAGG 
960 970 980 990 1000 1010 

1030 1040 1050 1060 1070 1080 

mRNApo t AGAACATTGATGTCATCATTTTTGCAACAGGATATAGTTTCTCTTTTCCCTTCCTTGAAG 



Macaque AGAACATTGATGTCATCATTTTTGCAACAGGATATAGTTTCTCTTTTCCCTTCCTTGAAG 
1020 1030 1040 1050 1060 1070 

1090 1100 1110 1120 1130 1140 

mRNApo t ATTCACTCGTTAAAGTAGAGAATAATATGGTCTC ACTGTATA AATAC ATATTCCCCGCTC 



Macaque ATTCACTTGTTAAAGTAGAGAATAATATGGTCTCACTGTATAAGTACATATTCCCAGCTC 
1080 1090 1100 1110 1120 1130 



Figure 6 (suite) 
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Alignemen t -inRNAFM02 

1150 1160 1170 1180 1190 1200 

mRNApo t ACCTGGACAAGTCAACCCTCGCGTGCATTGGTCTCATCCAGCCCCTAGGTTCCATTTTCC 

Macaque ACCTGGAGAAGTCAACCTTTGCATGCATTGGTC'TCATCCAGCCC^ 

1140 1150 1160 1170 1180 ^^^^AiTTTCC 

1210 1220 1230 1240 1250 isfin 

mRNApot CAACTGCTGAACTTCAAGCTCGTTGGGTGACAAGAGTTTTCAAAGGCTTGTGTAGCCTGC 
Macaque^CAACTCCTGAACra 

1270 1280 1290 1300 1310 1320 

mRWApot CCTt^GAGAGAACTATG^ 

Macaque^CCTCAGAGAGAACTAT^ 

1330 1340 1350 1360 1370 1380 

mRNApo C TTGGAGAAAGCCAGAGCCAGACGTTGC AGACC AATTATGTTGACTACTTGGACGAGCTCG 

Macaque TTGGAGAAAGCCAGAGCCAGACGTTGCAGACCAATOATGCTGACT^^ 

1320 1330 1340 1350 1360 ^^^auac,ctcg 

1390 1400 1410 1420 1430 1440 

mRNApo t CCTTAGAGATAGGTGCGAAGCCAGATTTCTGCTCTCTCTTGTTCAAAGATCCTAAACTGG 

Macaqu e CCTTAGAGATAGGTGCGAAGCCAGATTTCTGCTCTCTC'n'GTTC 

1380 1390 1400 1410 1420 1430 

1450 1460 1470 1480 1490 1500 

mRNApo t CTGTGAGACTCTATTTCGGACCCTGCAACTCCTATNAGTATCGCCTGGTTGGGCCTGGGC 

Macaque CTGTGAGACTGTTTOTCGGACCCTGCAA^ 

1440 1450 1460 1470 1480 1490 

1510 1520 1530 1540 1550 1560 

mRNApo t AATGGGAAGGATTCAGAAATGCCATCTTCACCC AGAAGCAAAGAATACTGAAGCCACTCA 

Macaque AATGGGAAGGAGCCAGGAGTGCCATCTTCACCCAGAAACAAAGGATA 

1500 1510 1520 1530 1540 1550 

1570 1580 1590 1600 1610 1620 

mRNApot AGACTCGGGCCCTGAAGGATTCATCTAATTTCTCAGTTTCTTTTCTGTTGAAAATCCTGG 

Macaque AGACTCGGGTCCTGAAGGATTCATCTAATTTCCCAGTTTCCT'ITCTGT^ 

1560 1570 1580 1590 1600 1610 

1630 1640 1650 1660 1670 1680 

mRNApot GCCTTCTTGCTGTTGTTGTGGCCTTTTTTTGCCAACTTCAATGGTCCTAGTCAGCATAAT 

Macaque GCCTTGTTGCTGTTGTTGTGGCCTTTTTCTGCCAAC'I^^ 

1620 1630 1640 1650 1660 1670 

1690 1700 1710 1720 1730 

mRNApo t GCTTTGGGCTTTATTATCTTGTC AGTCACTACCTCCTAAAGAAAAAAAAAA 

' » ' J5i:!tJi2:!:!s:::::::::;::::::::;:::::; x 

Macaque ACTTTGGGCTTTATTATCTTGTCAGTCACTACCTCCTAAAGAAAAAAAAAAAAAAAAAA 
1680 1690 1700 1710 1720 1730 
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Ali gnemen t - Pr o t FM02 



>gi| 1388193 (059453) flavin-containing monooxygenase form 2 [Macaca mulattal 
Length = 535 * * 

Score = 2723 (1271.0 bits). Expect = 0.0, P = 0.0 
Identities = 515/535 (96%), Positives = 524/535 (97%) 

mRNApot: 1 MAKKVAVIGAGVSGLISLKCCVDEGLEPTCFERTEDIGGVWRFKENVEDGRASIYQSWT 60 

MAKKVAVIGAGVSGLISLKCCVDEGLEPTCFERTEDIGGVWRFKE VEDGRASIYQSWT 
Macaque: 1 MAKKVAVIGAGVSGLISLKCCVDEGLEPTCFERTEDIGGVWRFKEKVEDGRASIYQSWT 60 

mRNApot: 61 NTSKEMSCFSDFPMPEDFPNFLHNSKLLEYFRIFAKKFDLLKYIQFOTTVLSVRKCPDFS 120 

ntskemscfsdfpmpedfpnflhnsklleyfrifakkfdllkyiqfqttvlsvrkcpdps 

Macaque: 61 NTSKEMSCFSDFPMPEDFPNFLHNSKLLEYFRIFAKKFDLLKYIQFQTTVLSVRKCPDFS 120 

mRNApot: 121 SSGOWKWTQSNGKEQSAVFDAVMVCSGHHILPHIPLKSFPGMERFXCOYFHSRQYKHPD 180 

SSGQWKWTQSNGKEQSAVFDAVMVC+GHH LPHIPLKSFPG+ERFKCQYFHSROYKHPD 
Macaque: 121 SSGQWKWTQSNGKEQSAVFDAVMVCTGHHFLPHIPLKSFPGIERFKGQYFHSRQYKHPD 180 

mRNApot: 181 GSEGKRILVIGMGNSGSDIAVELSKNAAQVFISTRHGTWVMSRISEDGYPWDSVFHTRFR 240 

G EGKRILVIGMGNSGSDIAVELSK+AAQVFISTRHGTWVMSR+SEDGYPWDSVFHTRFR 
Macaque: 181 GFEGKRILVIGMGNSGSDIAVELSKSAAQVFISTRHGTWVMSRVSEDGYPWDSVFHTRFR 240 

mRNApot: 241 SMLRNVLPRTAVKWMIEQQMNRWFNHENYGLEPQNICYIMKEPVLNDDVPSRLLCGAIKVK 300 

SMLRNVLPRT VKWMIEQQMN+WFNHENYGLEPONKYIMKEPVLNDDVPSRLLCGAIICVK 
Macaque: 241 SMLRNVLPRTWKWMIEQQMNQWFNHENYGLEPQNKYIMKEPVLNDDVPSRLLCGAIKVK 300 

mRNApot: 301 STVKELTETSAIFEDGTVEENIDVIIFATGYSFSFPFLEDSLVKVENNMVSLYKYIFPAH 360 

STVKELTETSAIFEDGTVEENIDVIIFATGYSFSFPFLEDSLVKVENNMVSLYKYIFPAH 
Macaque: 3 01 STVKELTETSAIFEDGTVEENIDVIIFATGYSFSFPFLEDSLVKVENNMVSLYKYIFPAH 360 

mRNApot: 361 LDKSTLACIGLIQPLGSIFPTAELQARWVTRVFKGLCSLPSERTMMMDIIKRNEKRIDLF 420 

L+KST ACIGLIQPLGSIFPTAELQARWVTRVFKGLC LPSERTMMMDIIKRNEKRIDLF 
Macaque: 3 61 LEKSTFACIGLIQPLGSIFPTAELQARWVTRVFKGLCHLPSERTMMMDIIKRNEXRIDLF 4 20 

mRNApot: 421 GESQSQTLOTNYVDYLDELALEIGAKPDFCSLLFKDPKLAVRLYFGPCNSYXYRLVGPGQ 480 

GESQSQTLQTNYVDYLDELALEIGAKPDFCSLLFKDPKLAVRL+FGPCNSY YRL GPGQ 
Macaque: 421 GESQSQTLQTNYVDYLDELALEIGAKPDFCSLLFKDPKLAVRLFFGPCNSYQYRLAGPGQ 480 

mRNApot: 4 81 WEGFRNAIFTQKQRILKPLKTRALKDSSNFSVSFLLKILGLLAVWAFFCQLQWS 535 

WEG r+aiftokqrilkplktr lkdssnf vsfllkilgl+awvaffcolqws 

Macaque: 481 WEGARSAIFTQKQRILKPLKTRVLKDSSNFPVSFLLKILGLVAWVAFFCQLQWS 535 
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AAACAAGAAA GCTAACTCTC ACCCNTTCTA TTCAATGTAG AACTGAAAGT CCTACCCAGA 
It) 20 30 40 50 60 

CAATCAAGCA AGAGAAAAAA AAATCAAATC AGAAATGAAA ATGGTAAATT GCCTTTATTT 
70 60 90 100 110 120 

ACAGTTGACA TCATATTTTA TATAGAAAGC CCTAAAGACT TCACCAAAAA CTTTTATAAC 
130 140 ISO 160 170 180 

TAATAAACAC ATTCAGTAAA GTTGCAGGAT ACAAAATCAA CACTAAAAAA TGGATTCCAT 
150 200 210 220 230 240 

TTCCATACAC CAACAACAAA CTATCCAAAA AAGAAATTAA GAAAGAAATT CCATTTACAA 
250 260 270 280 290 300 

TACCATCAAA AAGAAAAAAT ACTTACGAAT ACAATTAGCC AATAAGGTGA AACATCTGGA 
310 320 330 340 350 360 

CATTTAAAAC TATACTCTTT AAGGCAATTG AGGAAGACAC AAAAGAATCC AAAGATATTT 
370 380 390 400 410 420 

TGTGTTCATT AATTAATATT GTTAAAATGT CCATATAATC CAAACCAATT TACATATTTA 
430 440 450 460 470 480 

ATCCAATCCC TTTCAAAATA TAAATACCAT TTTTCACACA AATATGAAAA AACATTCCTA 
490 500 510 520 530 540 

AAATTTATAT GCAACCAAAA ATATCCCAGA TAGCCAAAGC AATCTTGAGC AAAAAGAACA 
S50 560 570 580 590 600 

AAGCTGGAAT CATCAGACTA CCTGATTTCA AAATATATTA CAAAGCTATA GTATTCAAAA 
£10 620 630 640 650 660 

CACTAATGTA CTGGCACCAA AACACACACA GACCAATGAA AGACTATAGA GACCCACCTA 
670 680 690 700 WO 720 

ATTACCCACA CATATACAAC CAACTAATCT TTCACAAAAC TGCCAAGGAC ACACAATCAC 
730 740 7S0 760 770 780 

AAAAGGATAG TTTCTTCAAT AAATGGTGGT GGAAAAAATT GGATATCCAC ATCCAAAAGA 
790 800 810 820 830 840 

ATCAAATTGG ACCCTTAGCT CACACAATAT GCAAAAATTA ACTCAAAATA TATTAAACAC 
850 860 870 880 890 900 

TTAAACTCTA AGTATAACAT GTATATAAAT CATGAAACTG TAAAACTACT GAAAATAAAA 
910 920 930 940 950 960 

ACATAGAGAC AAAGCTTTTT GAGATTTGTC TGGGCAATGA TTTTI TC AGA TATAACCCCA 
970 980 990 1000 1010 1020 

AAACCATAGG CAACAAAACC AAAAACGNCC CCAATGTGAC TGGCTTCAAA TTAAAAGCCT 
1030 1040 1050 1060 1070 1080 

TCTATTACAC GAAAGGAAAC AACATACTGA AGAGACAACC TATAGAATGA CAGAAAAGAT 
1090 1100 1110 1120 1130 1140 

TTGCAAACCA TGCATCTCAT ACGGGGTTAA TATCAAAATA TATAAGAAAC CTAAACATCT 
1150 1160 1170 U80 1190 1200 

CAACAGCAAG AAAACAAATA ACCGGATTTT AAAATGCGTA AAGGACCTGA ATAAACATCT 
1210 1220 1230 1240 1250 1260 

AAAAAAAAAA TGGCCATATG AAAAAATGCC CAACATCACT AATCATCAGC AAAATGCTAA 
1270 1280 1290 1300 1310 1320 

TCAAAACAAC AAGATATCAC CTCACACCTA TTAGGATGGC TATTATCAAA AAGATGAAAG 
1330 1340 1350 1360 1370 1380 

ATAACAACTG TTGGTCAGGA TGTGGAGTAA AGCGAATCCT TGAATGCTGT TGATGGCAAT 
1390 1400 1410 1420 1430 1440 

CTAAATTAGA ATACCCATTA TCGGAAACAG TATCAAGGTT CCTCAAAAAA GTAGAATAGA 
1450 1460 1470 1480 1490 1500 

ACTACCATAT GATTCTGCAA TCCTACCTCT GGGTATATAT CCACAGGACA TGAAATCAGT 
1510 1520 1530 1540 1550 1560 
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AAGTCyiAAGA CATCTCTGCA CTCCCATGTT CACTCCAAAA TTATTCACAA TGACCAAAAT 
"'^ "80 1590 .1600 1610 1620 

ATAGAATCAA CCTAACCATT TATCAACAAA TGCATAAACA AAATCTGOCA CTTAACTACA 

GTGGAATATT ATTCAGGCTT AAAAATGGAA AACATCTTGT TGCAACAATA TGGATGAACC 

* A/rfU 1730 1740 

TGACAGACAT TTTGCTATGT GA«.TTAACC TAGGCCCAGA AAGACAAATA CTGATCATTC 

1/BO 1790 1000 

TCACTTACGT CCAGAATCTA CAAAAGATAA ACTCACAGAA GCAAAGAGTA CTAGGGTGAT 

Aoju 1840 1B50 1360 

TTCCAGGGGC TTGACGCTGG GGGAAAT^A GTAATCTTGT TCAAATGGTA CAAAGTTTCA 

GTCATCCAGG ATGA..TATGT TCTGGAGATG TAATGTACAA TATGGTGACT ATGGTTAAM 

TACTGTATTC TATCCTTCAA ATTTGCTAAA AGAGTAGATC TTAAATGTTC TCACTcZ 

*u^u 2030 2040 

AXAATGC.AA CA^^OAGG .CAXAAG.AT G..;^..CC TTATCATJ^ .CAA.GGCGA 

CATAXATATA XAXACGATGT XXXGXGCCXX AAAXAXACCC AGXXTXXAXX XCXCAXACAC 

CXXACCXCAX GGXXXCCAXX CXGCACXCXG CCCAACXXXC CGXGXGCACX CXCXXGGGXA 

XCTGCTCXXG CXCCCAXGGX CCCXGXAGCX GACAACACXX ^CACCCAXX XCAAACCACA 

— — I^AA AGXCCXXXCX CAAACACXGA TCAAAAXGCA AA^XT j 

CAGXCCCCXC CCACACAGXA AAXXXCXCAC CCXXCXAGGX XXAAAXAGCC CC^^CA 

CXCXGXXACX AXGXGAAXCA TGGXCAAAAC XGXAGCAXAC XXAACAAXGX AXCXCXCXXC 

CXCXCAXCXA XCXGCCCXAA XGCXGXGACX GAXACCXAXX AAAXAXXXCC XACAXAAXAA 

XXCCXXXXCX XXXCCXXXXC TXXXCXXXCX CXXAAGGGGA GCCAGCACAT CTXCACAGXC 

CTGCCACAXC TXAGXXCXAX TAAXXGXGCC AGGXTAACCX CCXAAGCCCC ACXCXXXCXT 

CAGAAAAAXG CCCACAGXAA TACXTGCCXT ATAAGGXACX TXTGAAAACA AAXAACA^ 

TGXGTCTAAA GXCCXXAGTT XAGXGCCXGG CACCCAGXGA AXGCACAXXC XAAAGXG^XX 

AXXXTTAGTG GXAXT^CCC CCAXCAXTXC CXGAC^A GGCAGXCTGA AGCAXXTTAC 

ATACCATGTC XCAGAGTCTG CACTAGAACT TAGCTTCCXA GGAGACGXTA CXCTGXCCXT 

TTTTGTTGCC ACTGXAXCTG TAACATTGCA AACAATGCCX GGCAXGCAGX AAAXGCXCGA 

XTAATACTTG TTOAAXAACC CXCTGAAGGX TCCAXACTCX CXAAAGXAAG AGTAXCTTCX 
^SSO 2960 2970 2980 2990 300O 

XCATACTCTC TAAAGTAXGX CTTCXCACTA TXCCCATTTA XAGGGXATXG CAAAAAACAT 



3010 3020 3030 3040 3050 3O6O 

ITTCACT TTTTO^ 
3110 

Figure 10 (suite) 



AGCATCAAGX CAXCAATTXX TGCTCGCTXA GCAAATXTGA ACAGX«AGX XXXXCATTAG 



FEUILLE DE REMPLACEMENT (REGLE 26) 



wo 98/24914 



PCT/FR97/02226 



31/53 

f ragmentl . FMOx 

TATATTGA^ ATAATAATAC CTGCCTCACA AGGTTAATGG AAGAAAATAA ATGAAAAGCA 
3140 3150 3160 3170 3180 

CTTTGAAATA CGTCTCAGCA TTCTGAAGAT CTTCATTAAT CTCAGTCTAT TCrTAATCCT 
JX»u J2ug 3210 3220 3230 3240 

GTTCTTGGAC TGGCTAGTCT GAACCATTAG GCCCTCCAAC CTCACTGGTA TGACCTATAC 
J2i0 3260 3270 3280 3290 3300 

AGCCCTGAGC TTTAAGAGAA AAGCATGGAA CTTTAACTAC AAGGAGACAT GGAAAGGCCA 

CACACAGCTA GATTCCCAGC TGAGGGCGAG GTAGAGAAGC TCTGGAAATC ATCACCTTTA 

TCCCTTGCCT T.ACATATCT CTTCCTCCTG GGTCCTCCAT AGTACTCAGG GTCAGCCTGA 

AGATGGTTCA CCAGTAGAGA ACTGCTGGCG CTGAAGAAGA AGAAGACACT CTGGACAATG 

TTCTCCCCTT GTTTCATGAT CTTCCTCACT TTGGCCTATC AAATAACTCC AGGGACTTCA 

TCTTTTAGTT GATTAAGTAC CTGCGATACC ACCTTCTTAT ACCTCTAAAG ACACTCCCAA 
3510 3620 3630 3640 3650 3660 

GCTATCACAA TGCAGGGGGA GGCAGGAGAT CCACAACGTC TCATTTTCCT CATCATTnT 
3570 3680 3690 3700 3710 3720 

GACTAACAGC ACTTTCTGTG ATCTCATTAA ATCACAAATG CACTCTCAAT CCGGAAAATA 
3730 3740 3750 3760 3770 37B0 

GATCCCATCA TATGTCATAA TCAAAACCTT GCACTTTACT TTCACCTCTA ATCTTTTCAC 
3790 3800 3810 3820 3830 3840 

TATTACCTTC AGCTGAACCT GCACCTAGGA GAACCCTGAC CTCCTGGAAC GCAACCATGA 
^850 3860 3870 3880 3890 3900 

GCCTTTTCTC CTATATCGCC TTATCCTTCC ACTCCTCCTC CCCATCATCC TCATGCAAAA 
3920 3930 3940 3950 3960 

CTTTCCAACC CrTTTCACAAA ATTATATTTT CTCTCTTTGA AAAGCTGACA TTTTACAAAT 
3970 3980 3990 4000 4010 4020 

^"^^in ^^AATACA CTGAGCTGTA TCCACCAAAT TAACAGATTT CTAAAATCTT 
4040 4050 4060 4070 ^^4080 

GAAGGGATAT TACTAATTAC TTAATCCAAT TTGCTTATCT TACAGGGGAA GGATCTAAAT 
4090 4100 4110 4120 4130 4140 

TCCTGCAAGA ATTATCCCAA AATATACAGC CAAACACATG AATCACTGAC TTTTTAACTA 
4130 4160 4170 4180 4190 4200 

TAATATTACA TAACACTATC AATATTTTTA AAATTTATAA GAAGACACAA CTCCCTTTCA 
• 4220 4230 4240 4250 ^0 

TTTAATATCA TACCTATTAC AACAATTGCA AACCTAAAAA ACCACATTTC TAAGACTCTC 
4280 4290 4300 4310 4320 

TTCCAGTTAG GGATTCGATG CAATTAGTTT TCCCAGTGAG ACAGACATCT AGCCTCACAA 
4330 4340 4350 4360 4370 4330 

GCCAAACGGA AGCAAAACCT AAATTTTCCT GACAATGCTC ATCGGCAAAT CTATTCCAAC 
4390 4400 4410 4420 4430 4440 

AGCTGTGCTT ATATCACCTC AACTCCATGT TCCACCTTTT AGCCCCCCAA TTTCTATCTT 
4450 4460 4470 4480 4490 4SOO 

GCAGCCATCT GTGGTGATTG AAGCAGTTTC CTGCCCTCTC GATAGTACCT CTACTGGTCT 
4S10 4520 4530 4540 4550 4550 

GACCTCTCCA GTCCTGCAGC AACCTCCTAG TTCCTCCTCT TTCAGCTCTT TCACCTTTTC 
4570 4580 4590 4600 4610 4620 

CAACCACCTA ATTCCCTCTA GTATATACCT TTCTTCATGA TATATACTGT TTTTTATCTC 
4630 4640 4650 4660 4670 4680 
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CTGCACTAAA TCATGAGCAT ATGCATATAA ATCATAATAT GAAATCTTAA AAACAGAAGT 
46^0 4700 4710 4720 4730 4740 

ACTTTTGCTG AGGCATTAAG CATATAATCA GTCAGCAGGT CCCCAAACAT CTAATTCCTG 
4750 4760 4770 4780 4790 4800 

AATATCTCAT ATATCCTGTC TCCATTATCC ATTCCTCTAA TGCTACTCTA ATTTAAGTCC 
4810 4820 4830 4840 4850 4860 

TCAGTCTCTC TGGCCTAGAT TCTTGAAATA ACATCCTCGG nTTTGCTCT CCTTGATTCT 
4870 4380 4890 4900 4910 4920 

AGTCACCATC CTCTCTAGCC TCCAGGTGAA TCTGATCTTG TCTGATCTTC TCACTTCCTT 
4930 4940 49S0 4960 4970 4980 

GTTCAAAATT CTCGAATGGA CAACCCTAAT CCAGAAGGTA GTATCCAAAC CTCTGATTCT 
4990 5000 5010 5020 5030 5040 

GGCACTTCAG TATCCTTCAT AACCTATGTC CTGCATGTTT AACCCATATT TTGCTATTCC 
5050 5060 5070 5080 5090 5100 

CATCACTTAT GGTCCACCAA AACTGAACTA ATTCTACTTC CCCCATCACG TCTTCTTACT 
5110 5120 5130 5140 5150 5160 

TTTCTATGCA TTTTCACATA TTTTTCTCTC TGCCTTTTTT CTATTTCTTG TCCCTTATCT 
5170 5180 5190 5200 5210 5220 

CTCTGGAAAA CATCTATTCT TCCTTCAAGA CTCACCTCTC TTCTCACACT CCTTGAACCC 
5230 5240 5250 5260 5270 5280 

TCTCTTTCCT CCTCCAACTC GACCTAGATT TTTCTTCCTA CATCCTAGCA CTACACTGAA 
5290 5300 5310 5320 5330 5340 

CCATACTTCC ACTCTCACAT TTATCATCTC CCTCAACACT ACACTTCATC CTTCCAGATG 
5350 5360 5370 5380 5390 5400 

GAAAGCACTC TCTCTTCTCA CCTTTGAATC CCCCAAAAGA CTATTATAAT CCATGACATA 
5410 5420 5430 5440 5450 5460 

TAGTAGCCTG TCAGTACAGT GAAAGGAATC GCCAGAGGAA GGAAACGAGG GAAACACAAC 
5470 5480 5490 5500 5S10 5520 

CACAAAGGAC AGGTATAGAA GCCGGAGCGA CCCAGAGACA AGCTTCAGAC ACCACAATTC 
5530 5540 5550 5560 5570 5580 

TCTCTTTTGA GTTCACTACT TTTACAAGCT CATCTATAAG CGTTAGTTCA CCAACTCACA 
5590 5600 5610 5620 5630 5640 

TCAGGCCCTA ACTTTCCAGA AATTTGAGCT ACTTTTCACT CTTCCCACAA CAAAACCTTT 
5650 5660 5670 5680 5690 5700 

CATTATAGTC CAGCTGCATA GCCTTTGTTT ATATATTCTA TATTTCCAAA GCAAACATAA 
5710 5720 5730 5740 5750 5760 

ATGAAAGAAT CATTCTTCCC CTAATCTCCC AGGACTTTCA CCTTACAGCT CCAGTGCCCA 
5770 5780 5790 5800 5810 5820 

TGGCAGTCAC TGTTTTATAT TTTTTCTAAC AAGAACCAAA GACTTCATTC TTCCTTTTTC 
5830 5840 5850 5860 5870 5880 

CTACCCCTTT CTTTTTACTT CACCCATCCC TCCCCTCTTC TTCTCTTATC CCTACCACAC 
5890 5900 5910 5920 5930 5940 

TCCTCCTTCT CTTTCAGATT TTACTATCGC TCTATACCAT TAAAAATACA AGAAAAAAAA 
5950 5960 5970 5980 5990 6000 

GCAATTTTAC TTTAAGAATA ACTCCTCCCC CTTCCCCAGT TTTCACATCA AAACACATTC 
6010 6020 6030 6040 6050 6060 

TTAAATGCCA TTCTCTTCCA CATTTCGACA ACTCCTCATT CTCTGGGGAG AGAAAGGTCA 
6070 6080 6090 6100 6110 6120 

TTGCTTAAGA GCTGAAGTCC CTTAGAGCAT TCAAAATGAG GAGTGATTCT GTACAGAGGA 
6130 6140 6150 6160 . 6170 6180 

TATCATGCAG CAGGCTCGAT CTCTAGTTCC AATTCCTTTA TTTCTTACCT CTGACACCTT 
6190 6200 6210 6220 6230 6240 
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GAAGAAGTAG TTTCTACTCT CAGCATACCA AACCGTCATC TGCAATTGAC AGCATTGGAT 
6250 6260 6270 6280 6230 6300 

TGATGATCTT CAAGCTCCTT CCTGCTCTAG CATTCACTGA ATCTGCTATT TTTGACATAT 
6310 6320 6330 6340 . 6350 6360 

TGAATAATCA GAAGCAGCCA GTTTTAGAAT CTTATTATAG CAAAAGTGGT AAAAATAATX; 
6370 6380 6390 ' 6400 6410 C420 

AGCATATACT ATCAATGTGC ATCTATGTCT TCTTATCTTT GAGTGAGGAT CCTCATACAT 
6430 6440 6450 6460 6470 6460 

AAACCTTGGC TGATAATTTC TACTGAAAAA AATCGTAAGT ATTAAAGACA CTCTTCTCAA 
6490 6500 6510 6520 6530 6540 

GATGTTCTCT CCAGACTCTG CTACAGGCAA TCATGAGCAA GAGGCTTCCC ATCATCCGAC 
6550 6560 6570 6580 6590 6600 

CTGGAGTCAG TGGCTTGGCT GCCATATGGT GCTGTCTGGA GGAGGGGC7G GAGCCCACTT 
6610 6620 6630 6640 6650 6660 

GCTTTGAAAG GAGCGATGAT GTTGCAGGCC TCTGGAAATT CTCACTGAGT GGCACATCAT 
6670 6680 6690 6700 6710 6720 

TAGAACACCA GTGGAAGGAG ATGCATTCCA ATGCAAATCA AATCTGATCA GTTCTAATTC 
6730 6740 6750 6760 6770 6780 

AGATTTAGAA GGCAGATCAC AAAAGCTCCA AATCTGGAAA CTAAAATCTT ACCTCTCCAA 
6790 6800 6810 6820 6830 6840 

TCATACTAAT NGCCCAAAAA AACTATTTCA TACCAGCAAA ATTTCTCCTC AAAACGACAT 
6850 6860 6870 6880 6890 6900 

TTTCAGCTCA TTAAACATCA TCACCTCCAT GGTGAAATCC AGATCTCCAA CCTCTAAAGC 
6910 6920 6930 6940 . 6950 6960 

CCACTAATGT TGCTAATTAT TCAAAAATAT ACCATGGGCT TCCCAGGTAA GTGAAACAAT 
6970 6960 6990 7000 7010 7020 

TCTATTCTTT ATTGCTCTTA AATGCCAGGA ACACGACTAG AAAAGAGACA AACAAACCTC 
7030 7040 7050 7060 7070 7080 

CACTGAGATC CTGAGGTCAG AACTCCTGAC TTCTAATTTC AACTTGTACC TTTTCTACGC 
7090 7100 7110 7120 7130 7140 

AGATAAGATT TCACTCCAGT TGCTTTTGTT TCCCTGGACC TCAAATGCTC ATTTGTCAAA 
7150 7160 7170 7180 7190 7200 

TGCAGAGGAT ATGATTCTAT AATTAACTTA TGTCTATTGG GCAGATAGAC ^VTTATTATAG 
7210 7220 7230 7240 7250 7260 

ATGATGATTG TGTCTGCGGC TGTTGAATAG CCTATCACCT CCAAATCCAC AGGGAAAAAT 
7270 7280 7290 7300 7310 7320 

TATGGTCTTT GCCATTTGGC CTCATTGTAC AAATAATATA ATTAGGAAAT ACTCC7TGTA 
7330 7340 7350 7360 7370 7380 

AACACATTTT TTTTTAAATT TCAAAGCCAA GTTTGCAGAA ACTTCTACTT CTTCTCTCCT 
7390 7400 7410 7420 7430 7440 

GGATTTCCCA GCCATTCTAA TCAGTTGTCG ATGATACATA TTTGGCTTGA AAACATATTC 
7450 7460 7470 7480 7490 7500 

ACATCATTCA TATTCTAACT ACTTCCTGTC CTGGTCTCAG TTACTGCTCT GCCTCCCCCA 
7510 7520 7530 7540 7550 7560 

ATAGCCTCCT CCAATAGAGT ATATCAGTCC TAACTTAGAA CACATTTTTA TTCTTCTCCA 
7570 7580 7590 7600 7610 7620 

AGCTTTTTTT AAAAAAAATT GTGGTTTTGT AACCCTGAAA GCACTCCATG AGATATAAGC 
7630 7640 7650 7660 7670 7680 

TCATTAATTT TTATTTCCCA GTAGCGGGTA ATCAAGAGTT AATATTTTTC AACAATTTAA 
7690 7700 7710 7720 7730 7740 

TTTTCCCTAT TTACATTTCC TCAGCCAAAT GTGCACAGCT TAGAGTAAAT CATAAAATCG 
7750 7760 7770 7780 7790 7800 
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CTTTCTACCA TCTCCCTAGT AACAATTAAA TGATCCTTGA GCATCTATTC TCGTAGTTTG 
'7810 7820 7830 7840 7850 7S60 

TGCTAAGTAC 7GGGATGACA AATATGGAAT ATAATCACTC CTTGTAAATG GTTCCATTTC 
7870 7880 7890 7900 7910 7920 

ATTTCATTAA GCAAGCCATA ATATAATTCC CTAATCCTTT GATAGCAAAT GGGCAAAAAr 
7930 7940 7950 7960 7970 ^9^0 

TCATTTGATA GCCGAACCTC TTCTCAAATC CTAAGGTTAA ATACCGTGAA TTGGATCAAC 
7990 6000 8010 8020 8030 a040 

ATGAAGCTAA CTCTCACCTT CTGTTGCACG GCAGAAATTT TATTGCATTT GACAGATTCC 
8050 8060 8070 8080 8090 fllOO 

TCCCCCAGAT CTCACTAGGA GTATTATGGA GCAAAATCCA AAAATGTACA CATTCCAAAA 
8110 8120 8130 8140 8150 8160 

TATATCTGGC CCTAAGACTT TTAAAATAAC AGATTATATA ACTACAACAA CAACATAGAC 
8170 8180 8190 8200 8210 8220 

CTTGTCACCA TCAATTCAAT GGACGAGTCC CTCGACCGTT TAGAAGAGGC TCGACTACGC 
8230 3240 82S0 8260 8270 8280 

AAATCTTAGT AGCTCAAAGA AAACCTCCCA CAGGGATGAC ACTTACCCTT CAACGATAAC 
8290 8300 8310 8320 8330 8340 

CCCAGACAAG CAAAATAGAG GACCACCTCT GACACAACTC CTACAGAGTC CATTTCCCAA 
8350 8360 8370 8380 8390 8400 

TAAAGTCTGC GAATGGCACT CCATAGGCCT ATGCAGTCAT TCCCACTGTG CCACCACCAC 
8410 8420 . 8430 8440 8450 8460 

CTTAACACAG ACCAACAATC CATGAAACGC ACAGAAAAGC CAATCAACAT GCTCTCTCCA 
8470 8480 8490 8500 8510 8520 

CAGAGGGATC CATGAGTTAT CCAATATAGC CAGATCAGAA ACTTTACTTA AGGAAGCAAT 
8530 8540 8550 8560 8570 8580 

AATATGATAC AAAGATCACT AAGATTCAAA GTTCGATTCT GAGTTATCCA CAACAGCAAA 
8590 8600 8610 8620 8630 6640 

TTCTTCTTTT CCATAAGGTC ATGTCTATAA GCAAAATTCT ACTCAAAG7C CTGGTGAGGA 
8650 6660 8670 6680 8690 8700 

TATGGACCCA TACAAATACT CAAAACTTTA GCCTCCTCCA CATACCCCAG CCCTTCCTTC 
8710 8720 8730 8740 8750 8760 

TTTTCTTAGA AAAGTTGCTT GGCACAATAT ATAATCACAG AGGGATTTTT TTTATGTGTT 
8770 8780 8790 8800 8810 8820 

ACATAAGACT TTATCTTCTN AAGNCTTTTT TNCAGAAGCT CTTCTACCAC ACAGAAACGT 
8830 8840 8850 8660 8870 8880 

GCTAATTCTG AACTTTTCAC TATTTGCTTT TTCTGAGAAA TGAAAACCAA ATGGGATTTA 
8890 8900 8910 8920 8930 8940 

AATACTAGCA GGCTGAATGT GTCTTTTAAG TTTCATCCAC TCCTAAATAG GGCCTCCTGT 
8950 6960 8970- 8980 8990 9000 

CCTCAAAAGA TTTCATTACT GCTGTAATAA GAACTTGCTC AACAGCCAGG TCCGGTGCCT 
9010 9020 9030 9040 9050 9060 

CATCCCTATA ATCCCAGCAC TTTGGCACGC CAAAGCGGGT GGATCACGAG AGCTCAGCAG 
9070 9080 9090 9100 9110 9120 

TTCAAGATCA GCCTGGCCAA CACAGAAAAA CCCCATCTCT ACTAAAAACA CAAAAATTAG 
9130 9140 9150 9160 9170 918O 

CCAGGTGTGG 7GGTGGGTGC CTGTAATCCC AGCTACTCAG GAGGCTCAGG CAGGACAATC 
91S0 9200 9210 9220 9230 9240 

TCTTGAACCC AGGAGGCAGA GCTTGCAGTG ACCTCAGATC ATGCCACTGC ACTCCAGCCT 
9250 9260 9270 9280 9290 9300 

GCGCAATAGA GAAAGACTCC ATTAAAAAAA AAAAAAATGC TTA 
9310 9320 9330 9340 
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aaaaaaatgc ttaccaataq gttagtagca ttttgattgc aaaagctgaa aacaggacta 
10 20 30 40 50 60 

ttttgaactt tttcccactc atttattcct ttgttcattc aatgaataca tactgtgcac 
70 80 90 100 110 'l20 

tttatgcgta gggtactata ttaagcataa gctgcagaca agaggccagc cagcacctta 
130 140 150 160 170 180 

aaagccgtga gaaaacaagc atcagaataa ctataagtga ccatataatt agggcaataa 
190 200 210 220 230 240 

ggataatggg accttagtaa aactaaagat gatttggcag tagctgagag ggaaggtaaa 
250 260 270 280 290 300 

gaaagccatg acaaagttga aggcaacttt tgagcatatt tcaagggcat atttagacaa 
310 ■ 320 330 340 350 360 

ggagatatgg gacccataag cagagctgga ataggaaaga agaccaaggt aaactgctta 
370 380 390 400 410 420 

gacgcatgta caacattctg aaattaacct ctaactttgc cctcaagtta cttatgttct 
430 440 450 460 470 480 

cgtgggaaag atgagagatg aacacggtca tcatccaaga cagatggtgc ccacagctgc 
490 500 510 520 530 540 

ttagatctct ggttccaggg taaagctccc tcagctagag gcagagtcaa agttgaattt 
550 560 570 580 590 600 

ccccctcact ggctcaaacc acacctcata ttgaaataat aaaaacgcac gccccctgga 
610 620 630 640 650 660 

gcaactgacc tgttatctaa tacatttgct tttttgtgtt tgtttggaga acagtctttt 
670 680 690 700 710 720 

cgaaaaaatc ccaaggagct gtagtgtaca cactcttctc tcctggtgtt acaattggcc 
730 740 750 760 770 780 

gaggtcaagg ggcaaaaaag cagagattca ttcaagatgg aaatactcca aggccttaac 
790 800 810 820 830 840 

atCLgtttcc cagaacagag tcttacattc tctaaccagg ccccatccca cagttcagcc 
850 ^^860 870 880 890 900 

ctgccccctt tcaacaggca gctgaaaaaa cctccttccc acctctcctt ctcacaacca 
910 920 930 940 950 960 

tcagtagaag gcgctagctg tgggtgaaag ggaagcactc agcctgccaa actgctggac 
970 980 990 1000 1010 1020 

atgagccttc accctttttc tgacctccac aaaaatttta aaaagtttaa attcctgtoc 
1030 1040 1050 1060 1070 1080 

ttccacgctt atgagaaata cagcaaccat gaatagagga agattatgtt ttcaacttga 
1090 1100 1-110 1120 1130 114 0 

gaaaaaatac tgaggctttg ggcagccccc cacttcccca cggggacaca atcctctcaa 
1150 1160 1170 1180 1190 1200 

ccctttccag cactttttgt ttccctcttc cagaggtcat ctggtgtgag agggagatac 
1210 1220 1230 1240 1250 1260 
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acaccttgaa tccagcagca acgtgacatt ccatctcttt ccccccattg cacaagagcc 
1270 1280 1290 1300 1310 1320 

ccttccggac ctcgggaagc agaagctgcc agctctgaaa tgtattttca aggcagcaca 
1330 1340 1350 1350 1370 1380 

ttgtgtgcac ttttacccta ccctcacaac tgagaggaaa tgtttatttt caatttagct 
1390 1400 1410 1420 1430 1440 

tttgactgct tctaaaaaat aagccacttt tcaattacac agaggcttta aaatgaaoto 
1450 1460 1470 1480 1490 ISOO 

ccaagattta acacacgttc taagggctct ggtttcctgt gtttctttgg tgaggagtga 
1510 1520 1530 1540 1550 1560 

agtccagcaa ctggtgagcc aaagaatagg attcatttac aacagagcag tggttctcaa 
1570 1580 1590 1600 1610 1620 

agtgcggttc ctaaaccagc cacatcagca tcaccaggaa cctgatagaa atgcaaaaca 
1630 1640 1650 1660 1670 1680 

cccccagacc ccaccccaga cagattgaat ccgaaattct aagaataggg cccaagaacc 
1690 1700 1710 1720 1730 1740 

tacggcctag ggagcttcca ggcgattccc atcacgccaa agctgggaaa ccactgcaat 
1750 1760 1770 1780 1790 1800 

attgggttgt tgccagtgaa gagtttgcta aactccaaaa gcaaacaaat aggctaoaaa 
1810 1820 1830 1840 1850 I860 

tcagagcctc ttctagacag ttttgttttt tgtttttttt ttaacctgag tataagacca 
1"0 1880 1890 1900 1910 1920 

gaaccagtgg tggcacagga gaaagcaaaa accactaagt ggctataaag acagagctaa 
1930 1940 . 1950 1960 1970 1980 

cactgagggt aattacagta agaggattca catggaaaga gctccagttc tgtgccaggt 
1950 2000 2010 2020 2030 2040 

tacgcgaagg gctttccatt ccttatctta ctgagagctt ttaacttttg cttacgcttt 
2050 2060 2070 2080 2090 2100 

taaacatgaa aagggtttta gtcaaccaag aattgaacca ccgcgtccac tgaaggoaac 
2110 2120 2130 2140 2150 2160 

-acaattcttg gctttcccct taagctttct tattccccct aggaccacac agaagaaaoc 
2170 2180 2190 2200 2210 2220 

agagccagca tttaccagtc tgtattcaca aactcttcca aagaaatgat gtgctttcca 
2230 2240 2250 2260 2270 2280 

gacttcccct atccggatga ttacccaaac tatatacacc acagcaagct ccaggaatac 
2290 2300 2310 2320 2330 2340 

ataaagacat atgctcaaaa gaaggaactt ttaagataca tatagtttga ggtagaootc 
2350 2360 2370 2380 2390 2400 

tcataacttg tactgttgaa attaagatat gtgcgggtta gagaaaaagg aggcagcaaa 
2410 2420 2430 2440 2450 2460 

ctattataaa aattagagcc aaatgtttgg gcacctcagt aatcaaatgt tgggtcttrat 
2470 2480 2490 2500 2510 2520 
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tataaagcat tcatgcattg attttttctc tcctagactt actagtccac tagtctccga 
2530 2540 2550 2560 2570 2S80 

gagctttcag actaccttag aaaacggagg cagctagccc atcattgtcc actttccacc 
2590 2600 2610 2620 2630 2640 

ctcatgctct gatgttttgg aaataaccca aaacgctcta gcatatatta ggaatttcgt 
2650 2660 2670 2660 2690 2700 

cagttcaatg ccaatgagtt gtggttcaaa aaaccagagc atctggcagg gcttctccca 
2710 2720 2730 2740 2750 2760 

ttacattatg aaaaggctaa caacttaaat gggaaatata gtcattgccc ccatctttac 
2770 2780 2790 2800 2810 2820 

ccactcagtt cattagtttt tttattaaaa aggtgagatt tcagcattgt tcctgcgaga 
2830 2640 2850 2660 2870 2860 

ataatgtttt acatttatct gggactcttt attgagcatc tctgtctgca tgcttggaac 
2890 2900 2910 2920 2930 2940 

tctCaacctc aaccaactigc tgctaaatgc agaacactcg catatagtgg gaaaaacaat 
2950 2960 2970 2980 2990 3000 

cagcaaaatt atgaaccatg gtgatattca catcattatt ttacccggag tagccccaaa 
3010 3020 3030 3040 3050 3060 

tgtatagtta aaataaaact tcccaatagt cattttattc cactcattca tcacattcat 
3070 3080 3090 3100 3110 3120 

ttgctcccac tatggtgtta atatcaacaa acattaatga agttcctatt gtgtgcctgc 
3130 3140 3150 3160 3170 3160 

attgtgctat gtgttatatg taaaagaaaa agaggtctaa gacctagctc tcaagaagcc 
3190 3200 3210 3220 3230 3240 

atttcaaaac aaacatgtaa agagcaagta aaaagattcc agtaacaatt tcaatcaaag 
3250 3260 3270 3280 3290 3300 

agaaaatttt ttaaagcccc tcacgacttg tttataaata aaacaatcct atggagatca 
3310 3320 3330 3340 33S0 3360 

tgaagcaaga ggcaacactt tgggggaagg tatcttctag aggaggcaaa atttagttct 
3370 3380 3390 3400 3410 3420 

atttagcagg tgttttagat aaatgagtgg catgagtaaa attagagagg cgggaaaacg 
3430 3440 3450 3460 3470 3480 

ccctgctcat ttggagaaca gtgggcaaac caagctggtt aggagggaga tatatacgct 
3490 3500 3510 3520 3530 3540 

aggatgagat atggccacat atatcagtaa actagtgtgc actgtgactt tgaaaaatag 
3550 3560 3570 3580 3590 3600 

aggattattt tgcaaccatg caaaagaagt ccaaagaagg gacatccaga gcttatgtga 
3610 3620 3630 3640 3650 3660 

tggcaccaaa gttatcaaag attcagcttc acccatctta gcaccgtggc ctacatcatg 
3670 3680 3690 3700 3710 3720 

acgtttgccc tgtggtgcaa aacagttgct gaagcttgag ccgccacatc tgccttctag 
3730 3740 3750 3760 3770 3780 

gcaaaaaaaa aaaa 



3790 
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tttttctttt tttttttgag acggagtctc gccctgtcgc ccaggcgtjga gtccagtccc 
10 20 30 40 50 60 

gcaatctcgg ctcactgcaa cctccgcctc ccgggttcac accattctcc tgcctcaqcc 
70 80 90 100 110 120 

tcctgagtag ctgggaccac aggcgcccgc caccacgccc ggccaatttt ttgtattttt 
"0 140 150 160 170 180 

agtagagacg gggttcacca tgctagccag gacggtcttg atctcccgac ctcgccatcc 
200 210 220 230 240 

acccgcctcg gccccccaaa gcgctgggat tacaggcata agccaccgcg cctggccgca 
250 260 270 280 290 300 

aagttgctat atttctaaga taagagtatt tatgcagagc aaaagagatg ccaacgatca 
320 330 340 350 360 

aaccttgaga cattcccaca cttattgagt agatggaaga tgaggtcaga aaaggaggaa 
"0 380 390 400 410 420 

gccatgtcag tagagggtag ccataagaaa ataacacaga tctgttatat gacatcatcc 
430 440 450- 460 470 480 

acaaaaatat tcagtgtgat ttacccctaa accaaccaac ttgatgccaa aaagtaaatg 
500 510 520 530 540 

tactccagtg agtaattttt cttgtgagat tcaaagactc accgaagatt caccgtgact 
550 560 570 580 590 600 

ccaattttac catctttcta tacatttctg aacgaccaag agagctcgta acaattactt 
620 630 640 650 660 

cctccacaga aacaaggcaa gaaggaaaaa aactttcaca tgcagaatta caaatggaaa 
670 660 690 700 710 720 

aataaatttt ctagttttct taaagaccct ggcttccggt ataaagaaac gtcccagctt 
730 740 750 760 770 780 

cttagtcacg ggccaatggg ttgttgttac tgaaaaggat gggaaacagg aatctaccat 
790 800 810 820 830 840 

ttttgatgct gcaatgattt gttcaggaca tcacgtacac cccaacctgc caacggattc 
850 860 870 880^ 890 900 

ctttcctggt aagtttggaa aatatataat aacctaggga cttacacgca aacatcaaoa 
910 920 930 940 950 960 

gttagaaaca tatctttcta taggtattac ataatgatta ttcttagact tcaaaagaaa 
970 980 990 1000 1010 1020 

aaaattaagt ttaatgatag gatatagtaa taaatagcct cataagtccc tatgttaaaa 
1030 1040 1050 1060 1070 1080 

taatcaagga ctgcaagcca gagatcagac aaacacaagt tcctgtggag aagtgcggga 
1090 1100 1110 1120 1130 1140 

cccaaaaata agttccaaca gcacacgggg tctccgagca cagttacatt aaaaaaaagt 
1150 1160 1170 1180 1190 1200 

agagtccaac tgccaaatgg tttaaagaaa gacacgttta cttatgttat tnacaggaga 
1210 1220 1230 1240 1250 1260 

ctcctaggtt tctaatttca tcttcantcc acaatttgca aataaacttt agaaatctca 
1270 1280 1290 1300 1310 1320 



^^(^^ Jo 



FEUILLE DE REMPLACEMENT (REGLE 26) 



wo 98/24914 



PCT/FR97/02226 



39/53 



fragments .FHOx 

gtgatttgtg tgtgggtaca cacacgggtg tgtgtatagc agcatacttc attaccatcc 
1330 1340 1350 1360 1370 Hit 

gaaagtggca aacctcaaat aaatacaata tacatggagg cctcctccca tctttccttc 
"90 1400 1410 1420 1430 X440 

cttccttgcc acaggaacac aatctactca aagatattag agtttccatg tctaggtata 
1450 1460 1470 1480 1490 1500 

atgtccatag gccgaggaaa attaaagagt gaaggctcag gaggaatata agattaaaac 
1510 1520 1530 . 1540 , 15S0 1560 

tcttaatgtt aacgggcagc atatttaatg tttatgagca tgggatcaga acacctggcc 

1570 *1580 1590 1600 1610 1520 

tcaacttact attccactag ttccttacca cttaacttct ttgcctcaat tcccccttct 
1630 1640 1650 1660 1670 

tttaaaatag ggacaatagc ccaccatgca gggatgttat caagattaaa tagttaaaac 
1650 1700 1710 1720 1730 1740 

gtgtaaagca tttatcagag gacccagccc acagagccaa cttaataaat attaaccatt 
1750 1760 1770 1780 1790 1800 

attattatcg taacacacat tcncatgcct taagatcttt taaggaacta aaagtaagtc 
1810 1820 1830 1840 1850 i860 

ttagggggct taatgtcaaa aaatgctaaa tggataaatg cacttcaact agggaatttt 
1"0 1880 1890 1900 1910 1920 

ttaattacaa ctgataatag gtttaaaaag acacaaagaa aacatcttca taatttctga 
1930 1940 1950 1960 1970 isao 

aaatcagttc aaacaacttg ccatgttcca ctcaggcctg gaccagtttc gaggcaacca 
1990 2000 2010 2020 2030 2040 

cctccatagc cgggactata agaatccaga agccttcaag gggaagaggg tcctcgtgac 
2050 2060 2070 2080 2090 2i00 

tggtccgggg aattcgggat ctgacattgc tgccgagctc agccgcctgg ctacacaggt 
2110 2120 2130 2140 2150 3160 

acatgacgta aaggttttgg gaaataaacc taaggtaggg ctgtgctact aaatcagcag 
2170 2180 2190 2200 2210 2220 

ccaaggcaca gaggatggca cttctatgtc acaccacaag agatccaccc cctctatgtg 
2230 2240 2250 2260 2270 2280 

gcccttcaaa tcaaggagga cttgagacat cctccatgtg aagccaggta atgtggccca 
2290 2300 2310 2320 2330 2340 

tgctagtaag gaagtacatt ccactgaatc cagaagtaag. tgcatgagtg cgtgtatgta 
2350 2360 2370 2380 2390 2400 

cagatgagtg tgtatgtgtg tatttcttgt tttcatttta tattctgatc acctccaaat 
2410 2420 2430 2440 2450 2460 

agactagttc ctggtcaggc tcaatcttta tttatttaac agtatttatt acaacgcacc 
2470 2480 2490 2500 2510 2520 

atgcaaaaag cactgtgttt accactctga agttctgaaa gatatgcatg acttaatat" 
2530 2540 2SS0 2560 2570 2580 

tactaacatt aattcaatca acagcagatg ctcaacaaat attgggcact tactatactt 
2590 2600 2610 2620 2630 2640 

actatgcgtc agaactatga taaactaaaa ataaatgcat aaataagtta oactaatter 
2650 2660 2670 2680 2690 2700 

tgacttcaag aaagagtcaa tggatggaga tggagttgac aggtacacac agactatcae 
2710 2720 2730 2740 2750 2760 
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cagaggagac ggtgagtctt ccagtagaat taggtgtggc aatagcaaca cagggaaaag 
2770 2780 2790 2800 2810 2820 

agaatctaac tcagcctgga tgaggtcaag gaagacttcc cagaggactc caagctaaat 
2830 2840 2850 2860 2870 2880 

catgtatcat cgacagaccc taaagaaaca acacattttt aagaaaacag gttctcaata 
2990 2900 2910 2920 2930 294? 

aacaaattct taaatggatg taaacaaaac cttaattttt taaactaaaa attcccttca 
2950 2960 2970 2980 2990 3000 

gttatcacaa agttaaagtc tattttgcaa agacggtaaa atagataagc agccagaccc 
3010 3020 3030 3040 3050 3060 

atctcagggc tgaggcggtt gccatggttt gggttgctca ggagaagtcc ttggggtatg 
3070 3080 3090 3100 3110 3120 

tgcataggga gaactggaaa aggcaaccag agacagagaa cagaactaaa cccttgacac 
3130 3140 3150 3160 3170 3180 

ctcgccagcc taatttcagc tagagattta gctacacttt tcccacacct agtccactac 
3190 3200 3210 3220 3230 3240 

caccagccac aaccactggg gctcaccgga tcatctggtc cccaccagac ttgccatctt 
3250 3260 3270 3280 3290 3300 

agtctatgag tatgtgaaga ttaaaccatc acagttgaac acagagccct gttgttccta 
3310 3320 3330 3340 3350 3360 

gaggtatgat tctaatcctt tcaacaacca cacaccagcc ctcaggggca gtgaaagaat 
3370 3380 3390 3400 3410 3420 

cctgtctcta ctagtttaaa ttttagactt taaaaaaaat tttttttatt ttaagttcto 
3430 3440 3450 3460 3470 3480 

ggatacatgt acagaacatg cataggtctg cacatgccat ggtggttcgc tgcacctatc 
3490 3500 3510 3520 3530 3540 

aacccttcac ctagatttta agccccacat gcattaggta tctgtcctaa tgctctccct 
3550 3560 3570 3580 3590 3600 

cccctagccc tccatccccc cgacaggccc tggtgtgcgt tgttcccctt cctgcgtcca 
3filO 3620 3630 3640 3650 3660 

tgtgttctca tgattcaact cctgnnnnnn nnncttatga gcyagaacat gcagtattce 
3670 3680 3690 3700 3710 3720 

gttttctgtt cctgtgttag tttgctgagg atgatggttt ccagcttcat ccatgtccct 
3730 3740 3750 3760 3770 3780 

gcaaaggaca tgaactcatt ctttcttatg gctgctagac aacttattca gacccgcctt 
3790 3800 3810 3820 3830 3840 

ttaaaagtgt tcctacttgg atattgagga aaatgcacgg aagtgcccaa agaagcgtgt 
3850 3860 3870 3880 3890 3900 

tgtgtttgct tatttcttac agagtaatgc tgaaatctgt gttgcttttc cccaccaggc 
3910 3920 3930 3940 3950 3960 

cattatcagt accagaagtg cttcctgggt catgagtcgg gtctgggatg atggctatcc 
3970 3980 3990 4000 4010 4020 

ttgggatatg atgtatgtta cccgctttgc atcctttctc cggaatgtcc ttccttcatt 
4030 4040 4050 4060 4070 4080 
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catctctgac tggtcatatj tccaqaagat gaacacgtgg tttaagcatg agaactatga 
4090 4100 4110 4120 4130 4140 

cctgatgcct tcaaatgggc acttaaaaac ggaaatttnt ttttatccaa aaaaggggg, 
41S0 4160 4170 4180 4190 4200 

cactcattta atgaatttat tctccctaga acttactttt gttgtctcat cgagcctaga 
4210 4220 4230 4240 4250 4260 

aacattaaac tcaaggtttc acaggtgacg gaatatgccc agagaccacg tatggcttgg 
4270 4280 4290 4300 4310 4320 

aaaacttatt gaaattagtc cagtacagaa agggtatgga aaaatctgaa atggagatga 
4330 4340 4350 4360 4370 4380 

cgcaggcaga taaaccaccc tgacatgcat gatgcacttg tggtggccac aagctatagc 
4390 4400 4410 4420 4430 4440 

atagaacttt gaggactgaa caaactcaaa ttggtttttg gaagaacatc ttgtccgtgc 
4450 4460 4470 4480 4490 4500 

ttatgggtgt atgaagacat caacaataat acccgcttcc caagatggtt gcggcattca 
4510 4520 4530 4540 4550 4560 

ataatataaa aatataaaaa tcgctttcca aatgataaag ctctaaaaaa attggttctt 
4S70 4580 4590 4600 4610 4620 

cttagcctca atttttctaa cgtgcttcaa aggagcaaat aacaaaacag tgttaatcaa 
4630 4640 4650 4660 4670 4680 

catgtctcag caagtaggaa gtctcaaaac aaaagtgcac acttcctcca cccctgaaat 
4690 4700 4710 4720 4730 4740 

gttgacattt t.gcagaacc atcaggaggc atggaacaca taaag.aatg gagagccaca 

actaacgcgg cc.gcaaga. tagtcagac. ca..ca...a cctcctca.a gagacagggc 

ccaacattta ccaa.Cagga agccatccca gg.agaagaa ccagca.acc aacagaaaaa 

aagaacaccc aag.cggcaa gaaaagaaag aac.gagaaa c.c.acc.cc .ggccca.gc 

tagccaaaaa gctccactg. gcc.agagaa agacggcaag aaaaagga,g aac.gcaaa. 

caaaagagca ^atgccagat "aggagcca aactgtcagt ccaaagcact tatactacca 
5050 5060 5070 5080 5090 5100 

agtcttgcag gctgctataa ccctttaaaa tatgtcgatt ttatgcattc aaaattatgt 
5110 5120 5130 5140 5150 5160 

ttaacactgt ggcttgcttg acagtagagg gtgggaggag gaagagaatc agaaaaaaat 
5170 5180 5190 5200 5210 5220 

.«tatca„ .actat,=« a.taccca,, c,acaaaat. a.ctatacac caaaccccj, 

C,aca=acaa tc.acttata taacaaacca t„ac==cca aacctaaaat aaaa,t«tc 

aaaaattatg tttaatataj taagtcccac agcctgagct ggtcaagatt tcctatctta 
5360 5370 5380 5390 MOO 

taagageaac tataaateat attttggccc tgccatttag acaattaaaa catagtttta 
5410 5420 5430 5440 5450 5460 
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gaaattcatt cattccgaaa actaagcttc cctttggaaa gggttccaac caccctaAor 
5470 5480 5490 5500 5510 S520 

ttctggaggg agaaaggggg aggaaaaaca ggtttcattg cggtctatgt tctoctaeet- 
5S30 5540 SS50 5560 5570 5580 

tgtaaggtaa aagaagaggt tgcaggatta gacaaacaga aaatgatgtg gaagtatasia 
5590 5600 5610 5620 5630 5640 

gacaagtttc aggatttaca aggtttctct gtgcctgaga tacctgcagg aaactccgga 
5650 5660 5670 56B0 5690 5700 

atctcaaagg aaacttaaat caaaatgaaa tatattgtcc tgaaaaacac tattcccaga 
5710 5720 5730 5740 5750 5760 

attttggcaa ctaaaacgca atatcaaagt tgttacactt ttttgtggac acagctgato 
5770 5780 5790 5800 5810 5820 

aaagaaaacc aaacatggca ataaaacttc ccaccactgc aagtctgact tctccatata 
5830 5840 5850 5860 5870 5880 

agacaagacg ttaaagttat gataacagtg cacttataac aacagtgctc gcatgtgcca 
5890 5900 5910 5920 5930 5940 

ggaaccgttt taagcgcttt aaggataatt gatcatttaa ttttcacaac aacctatgaa 
5950 5960 5970 5980 5990 6000 

gaagattcca tcatcatccc cattttacac ataaagaaac aaatacagaa aagtaacaac 
6010 6020 6030 6040 6050 6060 

tagtaagaga tggagctagg ttatgaacct gggccatctg ctcccagagt tggcgttcct 
6070 6080 6090 6100 6110 6120 

aaccactcta gcatgtctat aaattagctt tagtctcatt taggaaagga attgccatga 
6130 6140 6150 6160 6170 6I8O 

gagaagagag tcagtggcac ccatgctgat gtttaagtgc ttgatgttat ttcaatgtca 
6190 6200 6210 6220 6230 6240 

tgggccgttg caggtatttc ttggaaatga gctatttaca gcaagggtgt ttgcctctca 
6250 6260 6270 6280 6290 6300 

tLgctgtagt tccctgagaa aagagcctgt gttcaacgat gagctcccat cccgcatcct 
6310 6320 6330 6340 6350 6360 

gtgtggcacc ctgtccatca agcccagtgt gaaggagttc acggaaaccc cagctgtgtc 
6370 6380 6390 6400 6410 6420 

tgaggatggg accatgtttg aggctatcga ctctgtcacc tttgcaacag gctatgatta 
«"0 6440 6450 6460 6470 6480 

ttcctacccc ttccttgatg agaccatcat gaaaagcaga aacaatgagg ttaccttgtt 
6490 6500 6510 6520 6530 6540 

taaaggcatc ttccccccac taatggagaa gccaaccttg gctgtgattg gcttggttca 
6550 6560 6570 6580 6590 6600 

gtcccctgga gctgccatcc ccacagcaga cctgcaagcc tggtgggctg ctaaagtatt 
6610 6620 6630 6640 6650 6660 

tgcaagtagg tgggccattc tgtctttcat tcattttatc aatgaacatt tactgaacac 
6670 6680 6690 6700 6710 6720 

ctgctatatg caaagcactg tgctagggat acaatgagaa caagacaaac atgttccttg 
6730 6740 6750 6760 6770 6780 



FEUILLE DE REMPLACEMENT (REGLE 26) 



wo 98/24914 



PCT/FR97/02226 



43/53 



fragments . FMOx 



acctctcaag gctcaaaac? gggtgtgggg gatgccataa caggggaaat tcgggggggc 
6790 6800 6B10 6820 6830 6B40 

tctagtgagg ggagttggac tgttgcacag agcaaacagt acacaggaag tcataaaggt 
6BS0 6860 6870 6880 6890 6900 

gagggaaagc atgaaatgtg taaggaccca gaaacatttt ggtggaaggg aatacaaagc 
6910 6920 6930 6940 6950 5960 

agaggcaggg agcggcaaga aatataggtt tataagccac gtcaaagagc ctaaacttct 
6970 6980 6990 7000 7010 7020 

catagggatt aaggacttcg caagatttta agcaagaaaa aaatagcaga ggataactgc 
7030 7040 70SO 7060 7070 7080 

aatgtcaggc tacattataa agattggaag ggccctggtg agggttggag gtgtgccaga 
7090 7100 7110 7120 7130 7140 

aacctcactg gtgtcaactt ctgtcagaat aacaaagtca ggccaccctg attcccatga 
7150 7160 7170 7180 7190 7200 

caatcttctt cctctctccc tctactccag accccatggt ctccaggggc cacaagcatg 
7210 7220 7230 7240 7250 7260 

cttacgtgag gaaatcaaga atatgaggac tacatggaga aaggcaacgt ctcaaacata 
7270 7280 7290 7300 7310 7320 

ttaatttact ccagtcatac tgaatattat cattattatt gaaaagtgtt cctttattca 
7330 7340 7350 7360 7370 7380 

ggtattctcc aaaacattga ccaatatagg tataacttac ccaacataac taatccataa 
7390 7400 7410 7420 7430 7440 

aaacttacac tattggtaat taacaaacca ttacaatcat ggaatatatg tatatacatt 
7450 7460 7470 7480 7490 7500 

gtctaaaact ttgcagataa ataaatttct atctcaaata caccatgaaa gaccatcatt 
7510 7S20 7530 7540 7550 7560 

caaataaacc ccaccatgaa atcttttgta aaggtgctcc ctgcaaaata ctcctattgc 
7570 7580 7590 7600 7610 7620 

ctttttcctt cgaaaggcac aacaatgcca agagcctggg gcattatgag aagaccggat 
7630 7640 7650 7660 7670 7680 

atagttcata aacctaagaa atttacatga agcaaatggt atcatttatt tattcagcaa 
7690 7700 7710 7720 7730 7740 

atacttactg aacacctact atgtgtcagg ctctaacctg gcacttagga cacaacaaca 
7750 7760 7770 7780 7790 7800 

aacgaagcag aacaaaattc tggcctctta ctttctagca gggtgtccag ccaacaccaa 
7810 7820 7830 7840 7850 7860 

tcatagggta ctaccaggtt gacataagac accaacgatg actgggaaat attcatgcac 
7870 7880 7890 7900 7910 7920 

tgcaaatttt agagtaactt tcttccactg ttacaaaggc aaacaagcta ccatcaccag 
7930 7940 7950 7960 7970 7930 

ttaaaagaag ttgcattgat gtagtgaaaC tcacaaaaag ctaaaacttg tccgctgccc 
7990 8000 8010 8020 8030 8040 

cctaaaacac cttgcatagt tgcagaagat gtttaaaatc ctatgcttcc ttccactacc 
8050 8060 8070 8080 8090 8100 
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tcatttaaaa tggcagaaac cttaaaggga actgttttac cagattcttt cttcaaaaaA 
BUO 8120 8130 8140 8150 ai60 

gttttaggaa aaggatacag aaaaaaaagg aagaaattat taagctatta tatgcatgaa 
8170 8180 8190 8200 8210 8220 

gtijtactgag cacatatgtt gaggattagg tcctctataa tgttaccgaa ataagagact 
8230 8240 8250 8260 8270 8280 

gagtgatttg aagctacaaa tgtctctgct gtcactatct cactacaggc cagctttgcc 
8290 8300 8310 8320 . 8330 8340 

atttcccaaa ggctcattaa cttttcagat ctttgtttct atgaactggt attttgctaa 
8350 8360 8370 8380 8390 8400 

agatatcaaa gacatctcca gctcctctta atacaaaagt tttcaggaat acagtttata 
8410 8420 8430 8440 . 8450 8460 

aaaaccaaat gatttccatc atatgtcatt atatatctct gatttgtgtc tttcaatatt 
8470 8480 8490 8500 8510 8520 

tttctcttca tttcctttct agactcatgt accctgccaa ccacgaacga aatgacggat' 
8530 8540 8550 6560 8570 8580 

gacactgatg agaaaatggg gaaaaaactc aagcggtaag cagctaaccg tacttgccaa 
8590 8600 8610 8620 8630 8640 

tagagcaagt tcctaaaatg tgcctttatg tgtagaaaaa cattaatatg ctttaatact 
8650 8660 8670 8680 8690 .8700 

gtcattagtc agagtttaca ttttctgaac acttgcaata atcaaaaaat gtttagatag 
8710 8720 8730 8740 8750 8760 

taaacagtca tcacacttct cttgtgtaac tcaagaatag aggttttcta tcagggataa 
8770 8780 8790 8800 8810 8820 

ttttgccccc caggtgacat atggcaaaac ctggagacac ttttggtca:: tgtgagtgga 
8830 8840 8850 8860 8870 8880 

gagggcacgc tatcagcatc ttatgagtag agaacaggga ttccgctaac catccaacaa 
8890 8900 8910 8920 8930 8940 

tgcagagcac agttcaccaa aacaattatc tggctcaaaa tgtcaatagt gctgaggtta 
8950 8960 8970 8980 8990 9000 

agaaacaact ctataaatga ctacagttga cctttgaaca acacaggctt gaactacatg 
9010 9020 9030 9040 9050 9060 

ggtccactta tacatggatn ttttcaatta acataantcc agattgggca tggcggccca 
5070 9080 9090 9100 9110 9120 

cgcctgtaat cccagcactt tgtgaggctg agacgggcgg anaaactgag gtcaggagct 
9"0 9140 9150 9160 9170 9180 

cgagaccagt ctggccaaca tggtaaaacc ctgtctctac taaaaacaca aaaaaaatta 
9190 9200 9210 9220 9230 9240 

gtcgagtgtg gtggtgtgca cctgtaatcc cagctactcg ggaggctgag gcaggggaat 
9250 9260 9270 9280 9290 9300 

tgcttgaatc agggaggtgg aggttgcagt gagccaagat cgcgccactg cactctagcc 
93i0 9320 9330 9340 9350 9360 

taggtgacag agtgagactc catctcacaa aaaaaaaaaa aaaaa 
9370 9380 9390 9400 
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aaaaaaaaaa aaaaaaaaag ccacaaaggc catttattaa caaggagcag aagtcagcac 
10 20 30 40 50 60 

caagattagg caggaannaa taagctaact actgttttgt gcaaatgcag tcagatttat 
70 80 90 100 110 120 

gatcaggatg gcccctacct atgaagctac ccccccaaac cctgaaggga aaaoatoaat 
130 140 150 160 170 ill 

accagcttcc tatcttttgg ttatacaaga ccctttttct ggatcagctc tgtcaatgct 
190 200 210 220 230 240 

ttgtccctga agtcagaaag tccttgccaa taagagactg cctcttaaag tttttttgat 
2S0 260 270 280 290 300 

atagacaatg cccccgacca cccagaaccc catgagttca acatggaagg catcgaagca 
JlO- 320 330 340 350 360 

gtctaatttc ccccaaacac aacattccaa ttcagccttt atatcaggga gtcataagga 
570 380 390 400 410 420 

cctttaaggc tcatcacata ccatactcta tggaaaagat agccaatgct gtggaagata 
430 440 450 460 470 480 

acccaacaga gagaacatca tgaaagtctg gaaggactat accactgaag acgccctaac 
500 510 520 530 540 

tgttacagaa aaagccatga aagccatcaa tcctaaaaca acatattcct cctggagaaa 
550 560 570 580 590 600 

actatgtcca gatgttatat atgacttcag aggatttaca acagaccagt cacagaaacc 
*1<^ 620 630 640 650 660 

atgaaaaaga ttatggatat ggcaaaataa aaaggtgagg gtgaagggct tcaagatatg 
6^0 680 690 700 710 720 

gatcatggag aaattcaaca gctaatagac accaccaata gacactttta attccacact 
730 740 750 760 770 780 

agaggaacta aaagatgact tgatggagat gagtccttcc aaagcagtgc cagatgagaa 
790 800 810 820 830 840 

cgaagacata gaaaaagcca tgccagaaac aaattgacat cagatcacct ggcagacaeig 
850 860 870 860 890 900 

ttccagttat ctaagacttc tttcgacttc ctttatacaa catggaccct tccatgatac 
910 920 930 940 950 960 

aggcactgaa actaaagcaa atgatagagg aaggattact accatataga aaattcttag 
970 980 990 1000 1010 1020 

agaaataaaa aagcaaagtc agacagaaat tataatatat ttccacaatt acaccaaccg 
1030 1040 1050 1060 1070 lOBO 

gcctgcctct cctgccccca attctacctc ctccatccct tccgcttccg ccaggcctga 
1090 .1100 1110 1120 1130 11?0 

aacagcaaga ccaacccctt ctgtttctcc tcctactcct cagcctactc aacataaaga 
1150 1160 1170 1180 1190 1200 

tgataaggat gaagacattt atgataaacc acttccactt aatgaatagt aaacatattt 
1210 1220 1230 1240 1250 1260 

tttcttcctc ataattttct taataacatt ttcttttctc catattactt tattgtaaga 
1270 1280 1290 1300 1310 1320 

atagtattta atacgtatga catataaaat atgtgttaac caactgtttg cattactoqt 
1330 1340 1350 1360 1370 1380 

aaggcttcca gtcaacaggt xattaagagt taagtatttg gggagtcaaa agttatacat 
1390 1400 1410 1420 1430 1440 

ggatttttga ctgcaagagg gctcaatgcc cctaacccct cagttcttcc aaagtcaact 
1450 1460 1470 1480 ia^^^O 1500 
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gatatciggaa gtttctttac tttttcaagc atttaacatt gcattgacat gtcaacctaa 
1520 1530 1S40 , 1S50 i|to 

aggaaaacac tgaggcaaat ttaatacaaa aagagaattg atctgggcca agtttgagga 
1570 1580 1590 1600 1610 1520 

ctgcaaccca ggagcacaga gtcaaattgc cctgaatatg cactccgttc gcaocacrttA 
1630 1640 1650 1660 1670 1680 

caagtaggtt ttttaaagga aatacaaaag agtcaacttc taagttgttt accaaoaaet 
1690 1700 1710 1720 1730 1745 

tacattaaaa ttatacaagc tattgattgg ctatatactg tccttcgtat cacaaattct 
1750 1760 1770 1780 1790 1800 

acgaacatga agatgatgag tgagacagct agtcaggaat aaaaacgcct cttaacaatt 
1810 1B20 1830 1840 1850 i860 

gccgccaggc tcggtagagg gcagcatgac aagtcccata cacgcggctc tctcacctto 
1870 1880 1890 1900 1910 1920 

ataaattttg catacctcac atagtgcaaa ctaccccgag ccatttttct cctctcacat 
1930 1940 1950 1960 1970 1980 

tgaatgccac aacgtagtca cccattcagg gcccagagaa gaaaagaaat ggaaccctca 
1990 2000 2010 2020 2030 2040 

gattcaacaa aacctctccc gcacaacttc agccagttga cgaacaactt gcagagtcoa 
2050 2060 2070 2080 2090 2100 

gcacttttat gtgctaacaa ttcatgcagc tcgataccct ttcctttaga gcccagtaaa 
2110 2120 2130 2140 2150 2160 

aataaaaatg aggaaataga gaggttaaaa tgttcatctt attgcttaaa tgataaoctc 
2170 2180 2190 2200 2210 2220 

ctcttcagag tttcaaaaag caaattacac catattccaa ctaaaagaac tatagaooco 
2230 2240 2250 2260 2270 2280 

gaaaggaggt gatctctttt ctctctgcca taaaaggtaa tggccaaoac ccctataaca 
2290 2300 2310 2320 2330 2340 

aaagacaggt taacaagaga aaacgtgaca gatttattac gtgcacacgt gtgcatoaoa 
2350 2360 2370 2380 2390 2400 

gccttacaaa acatgaactc aaaggagggc cagatcattc atgttcaaat atcctcttca 
2410 2420 2430 2440 2450 2460 

ctggggttag gggagatgga agtgcaaaag taaatgattt ttcagaggaa attaataaot 
2470 2480 2490 2500 2510 2520 

ccaaagaaca cagattagac caagttcctc tgggctttgg gggaggtgta accacccaac 
2530 2540 2550 2560 2570 2580 

agattcatct tgctcactgc ccagaaaagc tgatgccctg agaacagcag gtttctccaa 
2590 2600 2610 2620 2630 2640 

tagagagagt ttaataaaca cacagccgtc agaggcattt gaaccagagt gactccatct 
2650 2660 2670 2680 2690 2700 

tgaatagggg ctgggtaaaa tgaggctgag acccactagg ctgcattccc aggaggttao 
2710 2720 2730 2740 2750 2760 

gcattcttag tcacaggatg agaaaagagg ccagcacaag attcaggtca caaagacctg 
2770 2780 2790 2800 2810 2820 

gctgataaaa caggattcag taacgaagct ggccaaaacc caccaaaacc aagacgatga 
2830 2840 2850 2860 2870 2880 

aaaaagtgac ctctggtcgt cctcactact cattatatgc tgattataat gaattagcat 
2890 2900 2910 2920 2930 2940 

gctagaagac actcccacca gcactgtgat agtttacaaa tgccatggca atatcaggaa 
2950 2960 2970 2980 2990 3000 
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gttaccctat atagtctaaa aaggggagga accctcagtt ccgggaactg cccatttetr 
3010 3020 3030 3040 3050 3060 

tcctgtaaaa ctcatgaata atccacccct tgtttaacat gcaatcaaga aotaactara 
3070 3080 3090 3100 3110 3llo 

agtatactca gttgagcagc ccatgccact gctctgccta tgaagtagcc attcttttat 
3130 3140 31S0 3160 3170 3180 

tcctttactt tcttaataaa ctcgccttca ctttatggac tggccctgaa ttctttctto 
3190 3200 3210 3220 3230 3240 

tgagaggtcc aagaaccctc ttttggggcc tggccagcta aacggaagga caggagttta 
3250 3260 3270 3280 3290 330O 

ttactactca aaccagcctc catgaaaatt cagaggctag atttttttaa ggatagtttg 
33" 3320 3330 3340 3350 3360 

gcagtcaggg gctagggaat ggggaatgct gattggttgg gccagggatg aaaccatagg 
3370 3380 3390 3400 3410 342O 

gagtcaaagc ttgtcttctg gtcttcctgg gaggagacca catgacaaga tgaaccaatt 
3430 3440 3450 3460 3470 348O 

caccagtctg ggtagtgcca gccggcccat cagaatgcag ggtctgaaaa atatcttgag 
3490 3500 3510 3520 3530 3540 

caccaatggt aggtttcata acggtgatgt tacccacagg agcaattggg gacctctgac 
3550 3560 3570 3580 3590 3600 

tgcatgactc ctgagcccta atttcttatc ttgtggctaa tttgttagtt ctacaaaagc 
3610 3620 3630 3640 3650 3660 

agtctgatct ccaagcaagg agggggtttg ttttgggaaa gggctgctac catctttgct 
3670 3680 3690 3700 3710 3720 

tcaaagttaa actgtaaact aaatgtctcc catagttagc tcggcccatg ctcaggaatg 
3730 3740 3750 3760 3770 3780 

aataatggca gcttggagat tagaagaaag atggagtaat tacatttttt tttcacattt 
3790 3800 3810 3820 3830 3840 

ttttcactgt cacaattttt ttaaaggtga tttcagaggt aacatcacag gacatgooao 
3850 3860 3870 3880 3890 3900 

actaaaggga ggaaagtatg tcaaacaaag gccgtcctgt tctgcagacg aaacctcaca 
3910 3920 3930 3940 3950 3960 

gaaagcaact ctcagagtca gtagcctatg acgaaagctt ctctgtcaga cattcagcag 
3970 3980 3990 4000 4010 4020 

tgcctgactc tcagtctctc tctcctgcaa gttaatcttt cctagagtgg gcaagggagg 
4030 4040 4050 4060 4o70 4080 

cctccgagaa agcctagttt ccatcttctg tttacttcct tttattttct ccacagataa 
^050 4100 4110 4120 4130 4140 

aaatctcctt cacaaaaggc agcttttcag ggccgcttct gtctgcaggc cctctgaata 
4150 4160 4170 4180 4190 4200 

gccatctcaa aatctgtcaa cgaagtgtat attttgcagt aaaatatttt ttgttctccc 
4210 4220 4230 4240 4250 4260 

tagtatgaaa caatttatat tattagatta caggagtatt aaaaccatcc atgatctcac 
4270 4280 4290 4300 4310 4320 

ttttaaacaa accaatctga aagtctaaca ttggggcaga ttctaagcaa tgtcttataa 
4330 4340 4350 4360 4370 4380 

agaataatta tgtgttaatg agtaaactaa gttaattagt ctccttaaac cagaaaotca 
4390 4400 4410 4420 4430 4440 

gtttactcca ggccacatgg tcaaaggcaa aagtccaaca ttacatcaaa ctcaaataoa 
4450 4460 4470 4480 4490 4500 
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gattaggaag gaggagaaaa gcagctcact tagctaaaga aaaaacaata aattcaactt 
4510 4520 4S30 4540 4550 4560 

tgtggaaaag gagggcataa atggaggtgc tatctaaaat gttatttttc tgaaagaaaa 
4570 4580 4590 4600 4610 4620 

aataagaaat taatgctcct atttgcaact gtaacaccta ttccagtatg ttctcttctt 
4630 4640 4650 4660 4670 4680 

tcttcatgtt tggccagagc cagactttgc agacagatta catcacatat gtggatgagc 
4690 4700 4710 4720 4730 4740 

tgggctcttt cataggggcc aagcctaaca taccatggct cttcccgaca gatccccgcc 
4750 4760 4770 4780 4790 4800 

tggccctgga ggtgtacttt ggcccttgca gcccatacca gcttcgactg atgggaccag 
4810 4820 4830 4840 4850 4860 

ggaagtggga tggggccaga aatgccatcc tgacccagtg gaaccggaca gtgaagccaa 
4870 4880 4890 4900 4910 492O 

ccaggacaag agttgtcagt gaagttcagc gaccccatcc cttttacaat tcgcttaaaa 
<"0 4940 4950 4960 4970 4980 

tgctttcatt cccatcactc cttctggccg ttacacttac atcttactaa tgagaaagtc 
4990 5000 5010 5020 5030 5040 

tttgaggtct caaaattcag catagaagtg taatcacaca atacaacaca caccacacat 
5050 5060 5070 5080 5090 5100 

acacacacac aatcacaaca tagttcctct ctcctttcct gaagatatga aaaccagccc 
5110 5120 5130 5140 S150 5160 

tggcccattc gaattaaagt ataagcaaaa tggaaaatac tcagcccctc tccctctgtt 
5170 5180 5190 5200 5210 5220 

gggaatctgt tctctaaaag gcttttcaca tgctgaattg gcaaatttgg ggatgcttaa 
5230 5240 5250 5260 5270 5280 

gataagacag gaagttgaat aagcatgagc acagattttc aggctgaaca aagtttaaca 
5290 5300 5310 5320 5330 5340 

aaatgtaaag gcattctatt ttgtccatca tagtacatta accaatgtat cttccacatt 
5350 5360 5370 5380 5390 5400 

aactgaagcc attgacatta aatcaacata gagagacaag cttataccaa cacaacaaco 
5410 5420 5430 5440 5450 5450 

aagataaaac gaacacattg cttgaaagat acataccgcc aaagctctcc caagaaqaaa 
5470 5480 5490 5500 5510 5520 

catacaacct gaatagatct aaatctatca aagtacttga atttgtagtt taaaaactct 
5530 5540 5550 5560 5570 5580 

tccacaaaga acaggccaag aaccaggtct tcactggtta attctgtcaa acatttqaoa 
5590 5600 5610 5620 5630 5640 

aagcaatata ccaactatat gcaaaatttt ccagaagatt aaagaggaca gaataatcct 
5650 5660 5670 5680 5690 



5700 



cagctcatca tagccctgac acctaaacaa gacaaacaca tcctaaaaaa ataaaataca 

5710 5720 5730 5740 5750 5760 

gatcaatatc cttcatgaag atatatgcaa aaattcttaa caaatgttaa tataatcaaa 

5770 5780 5790 5800 5810 5820 

cagtttataa aatgaacagc ataaccaagt aagaattatt ctggaaaagc aatgttggtt 

5830 5840 5850 5860 5870 5880 

taatagtcaa tgtaattcac cacatttgta aactaaaaat gaaaaaccat aggatcatct 

5890 5900 5910 5920 5930 5940 

caatagatgc ataaaaagca tccgacaaaa gccaacatcc attcctgaag aaaactctca 

5950 5960 5970 5980 . 5990 6000 
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acaaa^tgat ^^aaggaaac ttcctcaaca tgaaaaaggg catctatgaa aaacctacag 
6010 6020 6030 6040 6050 6060 

caatatca. accgaatggt ggaaaac.aa acgc.gca.t Cctaagagca ggaacaata. 

aaaggcctcg gttc.cacca ct.c.ag.ca aca.cc.ac. gggg...c.a gccagcgcaa 

caaggaaaaa gaaagaggaa taaaagacat caaaag.gga a.gggagaag .agaacctjc 

tttattctta 9acaacataa ttgtctatac agaaattatt ctgaaatcta cataaaaatc 
o-^au 6260 6270 6280 6290 6300 

acagaacaaa taattatatt tctatatact aacagtaaac agtagaaaat tagaaaattg 
"10 6320 6330 6340 6350 6360 

taaactatta tttataacat ccaaaaacat gaaatattta ggataagcca gcataagaaa 

S."0 6380 6390 6400 6410 6420 

ggtaaaaacc atacactgaa agctaaaaaa catagctgag agtaattaaa ggtctaaata 
6430 6440 6450 6460 6470 6480 

aatggagaga tacactatat cctgggttga accaccgata ttgtggtgac gtcaattatc 
^450 fiSOO 6510 6520 6530 6540 

ctcaagttga tccataattt caatgcaata ctaatcaacc ccctaacatg cctttttata 
6550 6560 6570 6580 6590 6600 

gaaattgaaa actgattcta aaatgtataa ggtatttaaa ggacctagaa ttgtcaaaaa 
6610 6620 6630 6640 6650 6660 

ataactttga aaaggccggg cacaaaggct cacgccagta atcccagtat ttcgggaagc 
6670 6680 6690 6700 6710 6720 

tgaggcaggc ggatcacctg aggtcaggag ttcgagacca gcctggccaa catggagaaa 
"30 6740 6750 6760 6770 6780 

ccccatctct actaaaaata caaaattagc cagacgtggt ggtgcatgcc tgcaatccca 
6790 6800 6810 6820 6830 6840 

gctactcggg aggctgagac aggagaatcg cttgaggcgg aggttgcagt gagccgagat 
6850 6860 6870 6880 6890 6900 

tgtgccactg cactccagtc tgggcaacaa gagccaaact ccatttcaaa agaaaaaaca 
6910 6920 6930 6940 6950 6960 

aatgtggagc attaacacta cctgacttct gatttcagaa tttcctattt tatgaagcca 
«970 6980 6990 7000 7010 7020 

cagtaatcaa gtcagtatgt tatggtgtga agataaacaa taggtcaata aaaaagaatg 
7030 7040 7050 7060 7070 7080 

gaatgtctgg aaatagaacc acacaatatg gacaaaggtg aaaattcagt aaagacagga 
7090 7100 7110 7120 7130 7140 

gagtcttttc aacaaatgat gttggaacca ttggatatca tgcaatatgg aaaaaaaaaa 
7150 7160 7170 7180 7190 7200 

ccttcagtca atactttgta ctatatacaa aaagtaactg aaagaggact atagaactaa 
7210 7220 7230 7240 7250 7260 

aaccctaaaa cttctagcag aaaatgaaaa agaaaatctt tgggttaggc aaaaatgtct 
7270 7280 7290 7300 7310 7320 

tagatacaat actaaatgca caatattcat ttttaaaatt gtgtaaattg aacttcatca 
7330 7340 7350 7360 7370 7380 

aaattaagaa cagttctagc atattctcac tcacaggtgg gaattgaaca atgagatcac 
7390 7400 7410 7420 7430 7440 

atggacacag gaaggggaat atcacactct ggggactgtt gtggggtagg ggtagggtgg 
7450 7460 ^ 7470 '^^^^*ff "^^^^ 7500 
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agggatagca ttgggagata tacctaatgc taaatgacga gttagtggtg cagcgcacca 
7510 7520 7530 7540 7550 7560 

gcatgacaca tgtatacaca tgcaactaac ctgcataatg tgcacatgta ccctaaaact 
7570 7580 7590 7600 7610 7620 

taaagtataa caaaaaaaaa gaacagttcc aata.tcctc .aggaaagaa .acagcaag. 

acattgatac C.atgaca.c .acatcatcc gcacc.aa.a aaagcaggac gaaca..ccg 

acccaat..g .ctaattgga gagatggata ag.catag.a gaaaaagtcc agacc.gaaa 

agaaaaatgt ataccaaac. a.c.caa... g.....agaa .atgta.aa. ..a.cc.ag. 

aatcaaaa.c ggttcaaacc agacgtgtct ccaaag.a.t c.tgtg.aca tg.g.acgcg 

tacacacatg ctagtgttgt ^ttgtgttta gtatgatgct agattgtgca acagaaagag 
7330 7940 7950 7960 7970 7980 

tctgtaagaa ttataagctg atcctccaaa taccctatgc acatatctct gagtcctcto 
7990 8000 8010 8020 8030 B040 

ttcaatctgg ggaccaccaa tgaagactaa tctggaatct tggagagaga cacttgggaa 
8050 8060 8070 8080 8090 8100 

gaacaagaaa aataacattt tgagtggggg tctcttctct ggaacatgtc tcaggotato 
8110 8120 8130 8140 8150 8160 

agaatctcat tccctcctca gacccagtac tagagggatg ttcccctcaa caaagaccot 
8170 8180 8190 8200 8210 8220 

agtgaaagtt ggctaaacgg actgctgagc ccttcagact tagcttattt gagccaacta 
8230 8240 8250 8260 8270 8280 

gaaacttttt tgcaatccag acttcttgat attttattca atcatacgga taatatcaat 
8290 8300 8310 8320 8330 8340 

tcgcaccaaa ttaaacttga tggaatgttg ctcataacct ctgtgtattt ggtcctgtot 
8350 8360 8370 8380 8390 8400 

agtaagtaga cacaagtgtg gtccttccca tcatctttac caaccatgca aaataaaoca 
8410 8420 8430 8440 8450 8460 

agaacaaaga gccgtcaagg agtgacaaaa ggcgagggag catgctaact caaagccaac 
8470 8480 8490 8500 8510 8520 

tcatgcacct cattctactg attgggtagc ctgctcatct gtgaaatcta tgcttgcotci 
8530 8540 8550 8560 8570 8580 

tatatacaac ctgtaattga atctagtgta aggactacac cagacaaatt cattaataaa 
8590 8600 8610 8620 8630 8640 

ctaaccaaat aaaacccctt taccagttga ttcccaaaga caatcagccc ttcagtcaqa 
8650 8660 8670 8680 8690 8700 

ttaatagcaa atctcacagt taagaaacta ctatgttttg catcatcaga cacaqaagaa 
8710 8720 8730 8740 8750 8760 

accatatttt taatgtttta ctttgcctct aaaatcctag cataaattag catattttta 
8770 8780 8790 8800 8810 8820 

aaaaagggtt aagagtagta gtttatgcct ggaatcccag catcttagga ggcccagcca 
8830 8840 8850 8860 8870 8880 

caaagattgc ttaagcacag gagtttgaga ccagcctaag caacatagca aaacctcgtc 
8890 8900 8910 8920 8930 8940 

ctacaaaaaa attaaaatta aaaaattagc caggtgctat gactcagacg tgtgtcccct 
8950 8960 8970 8980 8990 9000 
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ccaaatctca tgttgaaatg tgatccccag tgttggaagt ggggccttgt gggaagtgat 
9010 9020 9030 9040 9050 9060 

tctctcataa atggcttggc gccctcccca gggtaatgag tgagttctca ctctattagt 
9070 9090 9100 9110 9120 

tcacgagagc tattatagtt gtttaaaaga gactggcacc tcctctcctc tcccttgcct 
9130 9140 9150 9160 9170 918O 

caattctcgt .9ctccctttc acaccatgtg acatgcctgc tcccccttca ccttctgcca 
9190 9200 9210 9220 9230 9240 

tgattgcaag caccttgagg ccccaccaga aacagatgtc ggcaccatgc ttcttgtacc 
9250 9260 9270 9280 9290 9300 

gtctgcagaa tgatgaacca aaataaacct cttttcttca taaattaccc agcctcaggt 
9310 9320 9330 9340 9350 9360 

atttctttat agcaacacaa aacgtgtaac tggcaaaagg gtcctgccgc ttgccacttt 
9370 9380 9390 9400 9410 9420 

tagaaagatg ccaacataac aagagcgaga tgtgacagag aaagagtgag tttcatcatc 
9430 9440 9450 9460 9470 9480 

tgtgttagca aggaaaagag tgggcagaat tccttcccaa aatttccact cttcaattcg 
9490 9500 9510 9520 9530 9540 

tgggaggaac acagggcttt tcttttaaga gacaggggct tggaatgcag gagaggaaaa 
9S50 9560 9570 9580 9590 9600 

gggcagctac acagatcaaa aggcaggccc ttagacatgg caccttgctc tgtatatacc 
9610 9620 9630 9640 9650 9660 

agtctcttta aggatataaa ccacaatctg gttcatacac tatgctgatg attataatac 
9670 9680 9690 9700 9710 9720 

attgataatt aacaactgta tatctggatg cagtgtcata atatggcttt ttagcaaaaa 
9730 9740 9750 9760 9770 9780 

gtacttgaag gtaaaatgaa taattagact aaaaaatgaa gccacaagga aatgatagcc 
9790 9800 9810 9820 9830 9840 

gaaatttaag ccacaaggaa atgatagctg aaattcctac gcgtaccttt aaaattcaca 
9850 9860 9870 9880 9890 9900 

ccttacactg aactgcagtg atctaggtgc cttcaaccgc cctgtcctta gacttaataa 
5910 9920 9930 9940 9950 9960 



ggtgtagata gcttcacaga ttaccctttc ttataataaa agaagtataa ccagagcctt 

9970 9980 9990 10000 10010 10020 

tatgactaca tttgttaatt tctcctccct gaaataagac aatgtaatct tcaggtattt 

10030 10040 10050 10060 10070 10080 

"'^^'^fni?^ tatatcacag attcatcacc accccaccca actaatcatc aaatgagttt 

10090 10100 10110 10120 10130 10140 

cgcagctaag aactgactca tattctatac- ctgccttctt aacgtattaa gaaaatcctt 

10150 10160 10170 10180 10190 10200 



aagctccatt aggctttggc caatatgaga catccaaatc cagatactct tgggactaga 
10210 10220 10230 10240 10250 10260 

ctgaaaaaat aagtgagcaa agcagataga ttgcatatta atcattccgt tggcacatta 
10270 10280 10290 10300 lOilO 10320 

aacaaagaga aatcatcctt tacttccgca aaaatatttg caggcccagg acaaccagat 
10330 10340 10350 10360 10370 10380 

tttctaaact ttttagagaa gccttgtatt gatatttcca tctgttattt tctggatttt 
10390 10400 10410 10420 10430 10440 

taatgtttag caacaacttt taaaaaaaga tttgtaggtc ttagatgggc tggagaaaac 
10450 10460 10470 10480 10490 10500 
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tcagtaaggg cagatttcag ccgaagaacc tccacttctc ctcaccttct ctggaaacaa 
lOSlO 10S20 10S30 10540 X0550 10560 

tatgcattgc catcttccag ccaccattct cagggttcag agggagtcta aacctctccc 
10570 10580 10590 10600 10610 10620 

aatttaaccc ttggttgata cttgtgttct ttctacaaca tccagcctcc tctttaacac 
10630 10640 10650 10660 10670 10680 

ctctttggac acaaaattca ttcattaccc tctggagcag ccttcagata actgaccocc 
10690 10700 10710 10720 10730 10740 

tctggcattt acccagcaca gccaccattc attcacagtg gcgaacacca gccctgcaag 
10750 10760 10770 U)780 10790 10800 

atagaaagag gttcaaatgg gggagtcaca gctacctgct caaaaactca aagcaaaaca 
lOBlO 10820 10830 10840 10850 10860 

ctgaactgac tccaaacagg agtcttcata acttattaga atatttaaaa aggaataatt 
10870 10880 10890 10900 10910 10920 

atttctagga atctgttata tggatattct tgcattaaag cacaaagatg gacqaacaag 
10930 10940 10950 10960 10970 10980 

gaaaatcatt gcagtctcgt ttataatcat gaaaacctgg aaacaattca aatatctaca 
10990 11000 11010 11020 11030 11040 

atagtataaa ataacataca gtaaaatata ggagatcaac gtatatatac tgacacggaa 
11050 11060 11070 11080 11090 lllOO 

ctcttttcaa aacatattgt ttaatgaaaa aagcaagtaa caaagtaaac aacatttctc 
11110 11120 11130 11140 11150 11160 

catttatgta aagtctagca cctgtgtata taaatgttat ttttacacag aaggaaatgt 
11170 11180 11190 11200 11210 11220 

ctgaaagcca attgtcatca gtagttttct ctgaagatta gactggggct ggaaatggga 
11230 11240 11250 11260 11270 11260 

ggaaggagta ggaaccgcac ttctgtttct acacactttc gcattgtttg agtttcttca 
11290 11300 11310 11320 11330 11340 

ttgaagacac tttcatacat gacttgtttt atacgtaaga aaataatttc ttaaataggt 
11350 11360 11370 11380 11390 11400 

accatctagt ccagaaagca cctacaagac gcctgattgg tgaaccccgc gaagacaaga 
11410 11420 11430 11440 11450 11460 

gaaaaacgaa agattttgtg tatgaatttt agccccaact gcaaaatatc tttctgccct 
11470 11480 11490 11500 11510 11520 

ctcaatgaca ctacttggtc ccgtgtgtca tgttaccacc ccctgtgtcc agatgaccgc 
11530 11540 11550 11560 11570 11580 

gtttgcgcat catataacaa tattaattgt gctattgcca gagagggctg cgaccaatga 
11590 11600 11610 11620 11630 11640 

ggtacatacc aaccagaatg cactttacca gaacacacag ttgtggataa gccaacaaaa 
11650 11660 11670 11680 11690 11700 

ggttgagcgc aggttgtgaa cttcccctta cccttcctga aaacaacatg aatcgtcacc 
11710 11720 11730 11740 11750 11760 

ttccagtcac cattctcaaa gttcaaaggg agcccaaaga tcccagccgc tttgccctgc 
11770 11780 11790 11800 11810 11820 

acatgagaaa gggaagaata atggaatcgc aaaagtcccc aggtaatgca cgtaattctc 
11830 11840 11850 11860 11870 11880 

tcataatgca tcacccagat caatgctgag atctggaaag agaggaccat aggttgtgat 
11890 11900 11910 11920 11930 11940 

aatgtcctgc cacttcccca tctatcctca actctgctgc aagtctggcc atagcacgcc 
11950 11960 11970 11980 11990 12000 
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ctgctcaaaa tccttcaaag gcttctcatc accttttgga taacgcccaa gctcaagagc 
12010 12020 12030 12040 12050 12060 

aaatgaggcc ctctaccatc tggctctact ctttctcact tttacctctt ccttgctccc 
12070 12080 12090 12100 12110 12120 

tcttaatact ctggtagcat tggactggtg atatttccta aactcatacc ataatoater 
12130 12140 12150 12160 12170 inIS 

tcaccccttt gctccaattc ctgctgttcc cctggtcaca gataccctcc atcaccccar- 
12190 12200 12210 12220 12230 mto 

acacatctcc accaccatag ccttgggcaa ctcctgctct ttgctattta tctttattct 
12250 12260 12270 12280 12290 12300 

ttctgcacag tggcttttcc tggggaccac tgtcttcatt cctctttgcc catacctatc 
12310 12320 12330 12340 12350 12360 

cttacatata catgttgaaa tgattactac agtcaaggca attaatatat ccatcatctc 
12370 12380 12390 12400 12410 12420 

acccttccct aattggtgtg tgtgtgtatg gtaagagcac caaaaatcta ctctcttagc 
12430 12440 12450 12460 12470 12480 

• aaatttctag tatacaatac aatgatatcc ^caagaggca ggcaaatgcc taggcagaca 
12490 12500 12510 12520 12530 12540 

ggggcaggtc cctggtgaaa ccccaccttc aagccaaaga cagcttaaag cccgaaagcc 
12550 12560 12570 12580 12590 12600 

aagctacaag tcaaatccac agactggatt gagaacctct cttcccattc ggtgcacttt 
12610 12620 12630 12640 12650 12660 

cctctgaatg atccccaccc ttcacctatt ttatatatac ctacccttcc caaaccggtt 
12670 12680 12690 12700 12710 12720 

ttttacactg ccatgcccac tgagttgtgc ctttgcttta accttttctg cgtactcaca 
12730 12740 12750 12760 12770 12780 

aaccaatcac cactccccca ctctgagccc ataaaagccc cggacccagc cacactgaag 
12790 12800 12810 12820 12830 12840 

gggagaccac ccaacttcat gtggtggacc accctcatgg cccccctttg ctgagagctg 
12850 12860 12870 12880 12890 12900 

ttctgtcact taataaagct cttctctgcc cttctcaccc ttcaatcgtc agcgtaacct 
12910 12920 12930 12940 12950 12960 

cacttctctt ggattcagga caagaacaca agaattgctg aacacaggta tgagctgtaa 
12970 12980 12990 13000 13010 13020 

cacaggtggg ctggggcact cctgggccag tcatggggtg agctagtgtg caaatgggca 
13030 13040 13050 13060 13070 13080 

gagtacctcc tgcagcaggc ctggggctga gcaaggccca gtttggggca tcgccagcca 
13090 13100 13110 13120 13130 13140 

gacacttcca gctggcaaaa gtgacagaaa aatcctgtat cagcaacacc attaaccata 
131S0 13160 13170 13180 13190 13200 

gtccacatgc tgcatatcag acctctagat ttattcatct gacaaaactg caactttgtt 
13210 13220 13230 13240 13250 13260 

tcccttttat ctacatctcc tgatctcccc ctacctctgg taaccaccct tctactctgt 
13270 13280 13290 13300 13310 13320 

ttatgtgtat tcagcatctt ttaagatgct gcatataaga aagatgtgga atacttttct 
13330 13340 13350 13360 13370 13380 

tttcctgtgg cttatttcac ttagcgtaat gtcctctagg atcatcatgt tgcaaatagc 
13390 13400 13410 13420 13430 13440 

aggatctcct tcctttctaa ggctgaataa tattcgtgtg tgtgtgtgtg tgtgtgtgtg 
13450 13460 13470 13480 13490 13500 

. FEUILLE DE REMPLACEMENT (REGLE 26) 



INTERNATIONAL SEARCH REPORT 



IntarKdUonal Application No 

PCT/FR 97/02226 



..pCui^PicA^NOP^^^^^^^ C12N15/11 C12N9/02 C12N5/10 

C12N1/21 C12Q1/26 C12Q1/68 C07K16/40 A61K38/44 
A61K39/395 A61K48/00 G01N33/50 601N33/573 

According to Iniemattonal Patent Classificatton(IPC) or to both national classittcation and IPC 



B. FIELDS SEARCHED 



Minimum documentation searched {dassification system followed by classification symbols) 

IPC 6 C12N C12Q C07K A61K GOIN 



Documentation searched other than minimum documentation to the extent that such documents are included In the fields searched 



Electronic data base consulted during the international search (name of data base and. where practical, search terms used) 



C. DOCUMENTS CONSIDERED TO BE RELEVANT 



Category '* Citation of docunnent. with indication, where appropriate, of the relevant passages 



Relevant to claim No. 



MCCOMBIE R. ET AL. : "Localization of 
human f1avin-conta1ning monooxygenase 
genes FM02 and FM05 to chromosome Iq" 
GENOMICS, 

vol. 34, no, 3, 15 June 1996, 
pages 426-429, XP002039325 

see the whole document, part. p. 426, 

last paragraph 

YUEH M. ET AL.: "AC U59453" 
EMBL DATABASE, 
25 June 1996, HEIDELBERG, XP002039326 



1.2,4,8 



see the whole document 



-/- 



1.4. 
8-10, 
12-14, 
16,17 



Further documents are Usted in the continuation of box C. 



Patent family members are listed in annex. 



" Special categories of cited documents : 

"A" document defining the general state of the art which is not 

considered to be of particular relevance 
"E" earlier document but published on or after the international 

tiling date 

"L" document which may throw doubts on priority claim(s) or 
which Is cited to establish the publication date of another 
citation or other special reason (as specified) 

"O" document referring to an oral disclosure, use, exhibition or 
other means 

"P" document published prior to the international filing date but 
later than the priority date claimed 



T" later document published after the intemationaf filing data 
or priority date and not in conftict with the application but 
cited to understand the principle or theory underiylng the 
invention 

"X" document of particular relevance: the claimed invention 
cannot be considered novel or cannot be considered to 
Involve an inventive step when the document Is taken alone 

"Y" document of particular relevance: the claimed invention 

cannot be considered to involve an inventive step when the 
document is combined with one or more other such docu- 
ments, such combination being obvious to a person sRilled 
In the art 

"&* document member of the same patent family 



Date of the actual comptatton of tiie international search 



31 March 1998 



Date of mailing of the international search report 



16/04/1998 



Name and mailing address of the ISA 

European Patent Office. P.B. 581 8 Patenttaan 2 
NL - 2280 HV Riiswiik 
Tel. (+31-70) 340-2040. Tx. 31 651 epo nl, 
Fax: (+31-70) 34O--30 16 



Authorized officer 



Kania, T 



Form PCT/iSA«lO (second sheets (July 1992) 



page 1 of 3 



INTERNATIONAL SEARCH REPORT 



Intemauonal Application No 

PCT/FR 97/02226 



C.<ConUnuatlon) DOCUMENTS CONSIDERED TO BE RELEVANT 


Categoiy ' 


Citation of document, with indication,wftere appropriate, of the relevant pas&age& 


Relevant to datm IMo. 


X 


EP 0 712 '932 A (SUMITOMO CHEMICAL CO) 22 
May 1996 

see the whole document 


1,4.5, 
8-18,20, 
21,23, 
24, 

26-28, 
60-63 


X 
A 


PHILLIPS I. ET AL.: "The molecular 
biology of the flavin-containing 
monooxygenases of man" 
CHEMICO-BIOLOGICAL INTERACTIONS, 
vol. 96, no. 1, 28 April 1995, 
pages 17-32, XP002039327 
see the whole document, part. p. 21/22 * 


1,2.4, 
8-18,20, 
21,23, 
24,26 

60-63 


X 


LARSEN-SU S. AND WILLIAMS D.: "Dietary 
indole-3-carbon11 Inhibits FMO activity 
and the expression of flavin-containing 
monooxygenase form 1 in rat liver and 
intestine" 

DRUG METABOLISM AND DISPOSITION, 
vol. 24, no. 9, September 1996, 
pages 927-931, XP002039328 
see the whole document 


47,49, 
51,54,56 


A 


SUNDEN S. ET AL.: "Fine mapping of the 

autosomal dominant Juvenile open angle 

glaucoma (GLCIA) region and evaluation of 

candidate genes" 

GENOME RESEARCH, 

vol. 6, no. 9, September 1995, 

pages 862-869, XP002039329 

cited in the application 

see the whole document 


1-63 


A 


LAWTON M. ET AL.: "A nomenclature for the 
mammalian flavin-containing monooxygenase 
gene family based on amino acid sequence 
identities" 

ARCHIVES OF BIOCHEMISTRY AND BIOPHYSICS, 
vol. 308, no. 1, January 1994, 
pages 254-257, XP002039330 
cited in the application 
see the whole document 


1-63 


A 


GASSER R.: "The flavin-containing 
monooxygenase system" 

tXrERlMENTAL AND TOXICOLOGIC PATnULUbY, 
vol. 48, no. 5. September 1996, 
pages 467-470, XP002039331 
see the whole document 

-/~ 


1-63 



Fomi PCT/ISAS10 (continuaifon ot socond sheet) (Juty 1992) 



page 2 of 3 



INTERNATIONAL SEARCH REPORT |nte,n.«onal Application no 

PCT/FR 97/02226 


C.(Contlnuetlan) DOCUMENTS CONSIDERED TO BE RELEVANT 


Category • 


Citation of document, with Indication, whera appropriate, ot the relevant passages 


Relevant to dalm No. 


P,X 


DOLPHIN C. ET AL.: "AC Y09267" 
EMBL DATABASE, 
6 February 1997, HEIDELBERG, XP002060752 
see the whole document 


1,2,4, 

8-10,16, 

17 



Form PCT/ISA/210 (continuailon ol second sheet) <Ju»y 1992> 



page 3 of 3 



INTERNATIONAL SEARCH REPORT 

information on patent family members 



Inten.^uonal Application No 

PCT/FR 97/02226 



Patent document 
cited in search report 



Publication 
date 



Patent tamily 
memt]er(s) 



Publication 
date 



EP 0712932 A 



22-05-96 



JP 
CA 



8140674 A 
2163136 A 



04-06-96 
19-05-96 



Fonm PCT/lSA/210 (patent tamily annex) (Jul/ 1692) 



RAPPORT DE RECHERCHE INTERNATIONALE 



Dem^. . Intemationate No 

PCT/FR 97/02226 



A.CLASSEMENTDEL'OBJETOELADEMANOE , , , 

CIB 6 CI2NI5/53 C12N15/86 C12N15/11 C12N9/02 
C12N1/21 C1201/26 C12Q1/68 C07K16/40 
A61K39/395 A61K48/00 G01N33/50 G01N33/573 

Selon la classHlcatlon Intematlonala dea brevets (CIB) ou & la fote seton la daaaHtoatlon nallonale el la CIB 



C12N5/10 
A61K38/44 



8. D0MAINE8 SUH LESQUELS LA RECHEnCHE A POBTE 



Documentation minlmale oansultee(8yst6me de classification suM des symtioles de elassement) 

CIB 6 C12N C12Q C07K A61K GOIN 



Documentation consulldo autre que ta documentation minimale dane ia me sure oQ ces documents ret6vent des domaines sur lasquela a portd la recherche 



Base de donn^es dlectronlque consultde au coure de la recherche Internationale (nom de ta base do donndea, et si celaest rdalisable, tormes de recherche 
utilise) 



C. DOCUMENTS CONSiDERES COMME PERTINENTS 



Cat^rie ** 


Identification des documents cltds. avecje cas 4cheant, 1* indication des passages pertinents 


no. des revendications visdes 


X 


HCCOMBIE R. ET AL. : "Localization of 
human flavin-containing monooxygenase 
genes FM02 and FM05 to chromosome Iq" 
GENOMICS, 

vol . 34, no. 3, 15 Juin 1996, 
pages 426-429, XP002039325 
* le document en entier, part. p. 426, 
dernier par. * 


1,2,4,8 


X 


YUEH M. ET AL.: "AC U59453" 
EMBL DATABASE, 
25 Juin 1996, HEIDELBERG, XP002039326 

voir le document en entier 

-/- 


1,4. 
8-10, 
12-14, 
16,17 


[ ){ [ Voir la suite du cadre C pour )a finde la liste des documents 


|)( I Les documents de families de brevets sont indiqudsen annexe 


" Categories spdciales de documents citds: 

"A* document ddflnlssarrt I'dtat gdndral de latechnique, non 

considdrd comma partlcuU^rement pertinent 
"E* document antdrieur. mais public & la date ded6p6t International 

ou apr6s cette date 

"L" document pouvant jeter un doute sur une revendcatton de 
priority ou cit^ pour determiner la date de publication d'une 
autre citation ou pour une raison specials (telle qu'lndlqude) 

"O" document se refdrant & une divulgation orala, & un usage, h 

une exposition ou tous autres moyens 
"P" document publld avant la date de ddpfttinternational. mais 

posterleurenr>ent la date de priority revendlquee 


T" document ulterieur pubfid aprds ladate de depdt international ou la 
date de priority et n'appartenenant pas & retat de la 
technique pertinent, mais cite pour comprendre le princIpe 
ou la theorie constituant la base def invention 

"X" document partlculidrement pertinent; 1* Invention revendlquee ne pout 
etre consideree comme nouvelle oucomme impiiquant una acttvite 
inventive par rapport au document considere tsoiement 

"Y" document particulidrement pertinent; rinvontion revendlquee 
ne peut dtre consideree comme impiiquant uneacttvite inventive 
lorsque le document estassocie k un ou plusleurs autres 
documents de meme nature, cette comblnaison etant evidente 
pour une pereonne du metier 
document qui fait partie de la m4frte famillede brevets 


Date d laquelle la recherche Internationale a eteeffectlvement achev^e 




Date d'expedltion du present rapport de recherche Internationale 


31 mars 1998 




16/04/1998 




Nom et adresse postale de radmlnlstratlonchargee de la recherche Internationale 
Office Europeen des Brevets, P.B. 5618 Patentlaan Z 
ML - 2280 HV RljswIjK 
Tel. (+31-70) 340-2040, Tx, 31 651 epo nJ, 
Fax: (+31-70) 340-3016 


Fonctionnaire autortse 

Kania, T 



Formutairo PCT/tSA/210 (dauxi^ feuaie) (juiDet 1902) 



page 1 de 3 



RAPPORT DE RECHERCHE INTERNATIONALE 



Oenna..«<e Internationale No 

PCT/FR <il/^lll<Q 



C.(sulte> DOCUMENTS CONSIDERES COMME PERTINENTS 


Cat^orle ^ 


Identification des documents cites, avec.le cas ech^ant. rindlcatlondes passages pertinents 


no. des revendications vlsdes 


X 


EP 0 111 932 A (SUMITOMO CHEMICAL CO) 22 
mai 1996 

voir le document en entier 


1,4,5, 
8-18,20, 
21,23, 
24, 

26-28, 
60-63 


X 
A 


PHILLIPS I. ET AL.: "The molecular 

biology of the flavin-containing 

monooxygenases of man" 

CHEMICO-BIOLOGICAL INTERACTIONS. 

vol. 96, no. 1, 28 avril 1995. 

pages 17-32. XP002039327 

* le document en entier, part. p. 21/22 * 


1,2,4, 
8-18,20, 
21,23, 
24,26 

60-63 


X 


LARSEN-SU S. AND WILLIAMS D.: "Dietary 
1ndole-3-carbon11 Inhibits FMO activity 
and the expression of flavin-containing 
monooxygenase form 1 in rat liver and 
Intestine" 

DRUG METABOLISM AND DISPOSITION, 
vol, 24, no. 9, septembre 1996, 
pages 927-931, XP002039328 
voir le document en entier 


47,49, 
51,54,56 


A 


SUNDEN S. ET AL.: "Fine mapping of the 

autosomal dominant Juvenile open angle 

glaucoma (GLCIA) region and evaluation of 

candidate genes" 

GENOME RESEARCH. 

vol. 6, no. 9, septembre 1996, 

pages 862-869. XP002039329 

cite dans la demande 

voir le document en entier 


1-63 


A 


LAMTON M. ET AL.: "A nomenclature for the 
mammalian flavin-containing monooxygenase 
gene family based on amino acid sequence 
identities" 

ARCHIVES OF BIOCHEMISTRY AND BIOPHYSICS, 

vol. 308, no. 1, Janvier 1994, 

pages 254-257, XP002039330 

cite dans la demande 

voir le document en entier 


1-63 


A 


GASSER R.: "The flavin-containing 

monooxygenase system" 

EXPERIMENTAL AND TOXICOLOGIC PATHOLOGY. 

vol, 48. no. 5. septembre 1996, 

pages 467-470, XP002039331 

voir le document en entier 

-/- 


1-63 



Fotmulaira PCT/IS A/210 (suite de la deuxl^me IdUDe) UuBlet 1dQ2) 



page 2 de 3 



RAPPORT DE RECHERCHE INTERNATIONALE 



Oemcbiue Intemationate No 

PCT/FR 97/02226 



C.(8Ulte) DOCUMENTS CONStOERES COMME PERTINENTS 



Categorie ' Identification des documents cites, avecle cas 6cheant. rindlcatlondes passages pertinents 



no. des revendtcations visdes 



p.x 



DOLPHIN- C. ET AL.: "AC Y09267" 
EMBL DATABASE, 

6 fevrler 1997, HEIDELBERG, XP002060752 
voir 1e document en entler 



1,2,4, 

8-10.16, 

17 



Fotnulaire PCT/ISA/21 0 (sUt9 d« la deuxidme feuiDe) (juBlet 1992) 



page 3 de 3 



RAPPORT DE RECHERCHE INTERNATIONALE 

Renselgnements relatlts aux membresde families do brevets 



Demaiiue International No 

PCT/FR 97/02225 



Document brevet citd 
au rapport de recherche 



Date de 
publication 



t^mbre(5) de ia 
famine de brevet(s) 



Date de 
publication 



EP 0712932 A 



22-05-96 



JP 
CA 



8140674 A 
2163136 A 



04-06-96 
19-05-96 



Fonrndalre PCT/ISA/210 (amexo famtUas da brevets) Quim 1 992) 



